Book a Demo!
CoCalc Logo Icon
StoreFeaturesDocsShareSupportNewsAboutPoliciesSign UpSign In
labmlai
GitHub Repository: labmlai/annotated_deep_learning_paper_implementations
Path: blob/master/translate_cache/neox/samples/generate.si.json
4923 views
1
{
2
"<h1>Generate Text with GPT-NeoX</h1>\n<p>This shows how to generate text from GPT-NeoX with a single GPU.</p>\n<p>This needs a GPU with more than 45GB memory.</p>\n": "<h1>GPT-\u0db1\u0dd2\u0dba\u0ddd\u0d9a\u0dca\u0dc3\u0dca\u0dc3\u0db8\u0d9f \u0db4\u0dd9\u0dc5 \u0da2\u0db1\u0db1\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1</h1>\n<p>\u0dad\u0db1\u0dd2GPU \u0d91\u0d9a\u0d9a\u0dca \u0dc3\u0db8\u0d9f GPT-neox \u0dc0\u0dd9\u0dad\u0dd2\u0db1\u0dca \u0db4\u0dd9\u0dc5 \u0da2\u0db1\u0db1\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1\u0dda \u0d9a\u0dd9\u0dc3\u0dda\u0daf \u0dba\u0db1\u0dca\u0db1 \u0db8\u0dd9\u0dba\u0dd2\u0db1\u0dca \u0db4\u0dd9\u0db1\u0dca\u0dc0\u0dba\u0dd2. </p>\n<p>\u0db8\u0dda\u0dc3\u0db3\u0dc4\u0dcf 45GB \u0da7 \u0dc0\u0da9\u0dcf \u0dc0\u0dd0\u0da9\u0dd2 \u0db8\u0dad\u0d9a\u0dba\u0d9a\u0dca \u0dc3\u0dc4\u0dd2\u0dad GPU \u0d91\u0d9a\u0d9a\u0dca \u0d85\u0dc0\u0dc1\u0dca\u0dba \u0dc0\u0dda. </p>\n",
3
"<h2>Generate text</h2>\n": "<h2>\u0db4\u0dd9\u0dc5\u0da2\u0db1\u0db1\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1</h2>\n",
4
"<h3>Predict the next token</h3>\n<ul><li><span translate=no>_^_0_^_</span> is the model </li>\n<li><span translate=no>_^_1_^_</span> are the input token ids </li>\n<li><span translate=no>_^_2_^_</span> is the device of the model</li></ul>\n": "<h3>\u0d8a\u0dc5\u0d9f\u0da7\u0ddd\u0d9a\u0db1\u0dba \u0db4\u0dd4\u0dbb\u0ddd\u0d9a\u0dae\u0db1\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1</h3>\n<ul><li><span translate=no>_^_0_^_</span> \u0d86\u0d9a\u0dd8\u0dad\u0dd2\u0dba \u0dc0\u0dda </li>\n<li><span translate=no>_^_1_^_</span> \u0d86\u0daf\u0dcf\u0db1 \u0da7\u0ddd\u0d9a\u0db1 \u0dc4\u0dd0\u0db3\u0dd4\u0db1\u0dd4\u0db8\u0dca \u0dc0\u0dda </li>\n</ul><li><span translate=no>_^_2_^_</span> \u0d86\u0d9a\u0dd8\u0dad\u0dd2\u0dba\u0dda \u0d8b\u0db4\u0dcf\u0d82\u0d9c\u0dba \u0dc0\u0dda</li>\n",
5
"<p> </p>\n": "<p> </p>\n",
6
"<p>Append the predicted token </p>\n": "<p>\u0db4\u0dd4\u0dbb\u0ddd\u0d9a\u0dae\u0db1\u0dba\u0d9a\u0dc5 \u0da7\u0ddd\u0d9a\u0db1\u0dba \u0d91\u0d9a\u0dca \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
7
"<p>Device </p>\n": "<p>\u0d8b\u0db4\u0dcf\u0d82\u0d9c\u0dba </p>\n",
8
"<p>Eval model </p>\n": "<p>\u0d91\u0dc0\u0dcf\u0dbd\u0dca\u0d86\u0d9a\u0dd8\u0dad\u0dd2\u0dba </p>\n",
9
"<p>Get next token. Note that we only feed the last token to the model because we cache the key/value pairs of previous tokens. </p>\n": "<p>\u0d8a\u0dc5\u0d9f\u0da7\u0ddd\u0d9a\u0db1\u0dba \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1. \u0db4\u0dd9\u0dbb \u0da7\u0ddd\u0d9a\u0db1 \u0dc0\u0dbd \u0dba\u0dad\u0dd4\u0dbb/\u0d85\u0d9c\u0dba \u0dba\u0dd4\u0d9c\u0dbd \u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2 \u0d9a\u0dbb\u0db1 \u0db1\u0dd2\u0dc3\u0dcf \u0d85\u0db4\u0dd2 \u0d86\u0d9a\u0dd8\u0dad\u0dd2\u0dba\u0da7 \u0d85\u0dc0\u0dc3\u0dcf\u0db1 \u0da7\u0ddd\u0d9a\u0db1\u0dba \u0db4\u0db8\u0dab\u0d9a\u0dca \u0db4\u0ddd\u0dc2\u0dab\u0dba \u0d9a\u0dbb\u0db1 \u0db6\u0dc0 \u0dc3\u0dbd\u0d9a\u0db1\u0dca\u0db1. </p>\n",
10
"<p>Get the tokens </p>\n": "<p>\u0da7\u0ddd\u0d9a\u0db1\u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1 </p>\n",
11
"<p>Get token ids </p>\n": "<p>\u0da7\u0ddd\u0d9a\u0db1\u0dca\u0dc4\u0dd0\u0db3\u0dd4\u0db1\u0dd4\u0db8\u0dca\u0db4\u0dad\u0dca \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1 </p>\n",
12
"<p>Imports </p>\n": "<p>\u0d86\u0db1\u0dba\u0db1 </p>\n",
13
"<p>List of layers to load. This is used for testing. You can assign a subset of layers like <span translate=no>_^_0_^_</span> so that it only loads the first to transformer layers. </p>\n": "<p>\u0db4\u0dd0\u0da7\u0dc0\u0dd2\u0dba\u0dba\u0dd4\u0dad\u0dd4 \u0dc3\u0dca\u0dae\u0dbb \u0dbd\u0dd0\u0dba\u0dd2\u0dc3\u0dca\u0dad\u0dd4\u0dc0. \u0db8\u0dd9\u0dba \u0db4\u0dbb\u0dd3\u0d9a\u0dca\u0dc2\u0dcf \u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0dc3\u0db3\u0dc4\u0dcf \u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0dc0\u0dda. \u0da7\u0dca\u0dbb\u0dcf\u0db1\u0dca\u0dc3\u0dca\u0dc6\u0ddd\u0db8\u0dbb\u0dca \u0dc3\u0dca\u0dae\u0dbb \u0dc0\u0dbd\u0da7 \u0db4\u0dc5\u0db8\u0dd4 \u0db4\u0da7\u0dc0\u0db1\u0dd4 \u0dbd\u0db6\u0db1 <span translate=no>_^_0_^_</span> \u0db4\u0dbb\u0dd2\u0daf\u0dd2 \u0d94\u0db6\u0da7 \u0dc0\u0dd0\u0db1\u0dd2 \u0dc3\u0dca\u0dae\u0dbb \u0d8b\u0db4 \u0d9a\u0dd4\u0dbd\u0d9a\u0dba\u0d9a\u0dca \u0db4\u0dd0\u0dc0\u0dbb\u0dd2\u0dba \u0dc4\u0dd0\u0d9a\u0dd2\u0dba. </p>\n",
14
"<p>Load layers </p>\n": "<p>\u0dc3\u0dca\u0dae\u0dbb\u0db4\u0dd6\u0dbb\u0dab\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
15
"<p>Predict 100 tokens </p>\n": "<p>\u0da7\u0ddd\u0d9a\u0db1100 \u0d9a\u0dca \u0db4\u0dd4\u0dbb\u0ddd\u0d9a\u0dae\u0db1\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
16
"<p>Print </p>\n": "<p>\u0db8\u0dd4\u0daf\u0dca\u0dbb\u0dab\u0dba </p>\n",
17
"<p>Prompt to complete </p>\n": "<p>\u0dc3\u0db8\u0dca\u0db4\u0dd6\u0dbb\u0dca\u0dab\u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0da7 \u0dc0\u0dd2\u0db8\u0dc3\u0db1\u0dca\u0db1 </p>\n",
18
"<p>Return predicted token </p>\n": "<p>\u0db4\u0dd4\u0dbb\u0ddd\u0d9a\u0dae\u0db1\u0dba\u0d9a\u0dc5 \u0da7\u0ddd\u0d9a\u0db1\u0dba \u0d86\u0db4\u0dc3\u0dd4 \u0dba\u0db1\u0dca\u0db1 </p>\n",
19
"<p>Run the model </p>\n": "<p>\u0d86\u0d9a\u0dd8\u0dad\u0dd2\u0dba\u0db0\u0dcf\u0dc0\u0db1\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
20
"<p>Set the state to use cached activations </p>\n": "<p>\u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2\u0dc3\u0d9a\u0dca\u0dbb\u0dd2\u0dba \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dca \u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0da7 \u0dbb\u0dcf\u0da2\u0dca\u0dba\u0dba \u0dc3\u0d9a\u0dc3\u0db1\u0dca\u0db1 </p>\n",
21
"<p>Setup <a href=\"../utils/cache.html\">cache</a> to cache intermediate key/value pairs for faster generation </p>\n": "<p>\u0dc0\u0dda\u0d9c\u0dc0\u0dad\u0dca\u0d8b\u0dad\u0dca\u0db4\u0dcf\u0daf\u0db1\u0dba \u0dc3\u0db3\u0dc4\u0dcf \u0d85\u0dad\u0dbb\u0db8\u0dd0\u0daf\u0dd2 \u0dba\u0dad\u0dd4\u0dbb/\u0dc0\u0da7\u0dd2\u0db1\u0dcf\u0d9a\u0db8\u0dca \u0dba\u0dd4\u0d9c\u0dbd <a href=\"../utils/cache.html\">\u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2</a> \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0da7 \u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2\u0dba \u0db4\u0dd2\u0dc4\u0dd2\u0da7\u0dd4\u0dc0\u0db1\u0dca\u0db1 </p>\n",
22
"Generate Text with GPT-NeoX": "GPT-\u0db1\u0dd2\u0dba\u0ddd\u0d9a\u0dca\u0dc3\u0dca \u0dc3\u0db8\u0d9f \u0db4\u0dd9\u0dc5 \u0da2\u0db1\u0db1\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1"
23
}
24