Book a Demo!
CoCalc Logo Icon
StoreFeaturesDocsShareSupportNewsAboutPoliciesSign UpSign In
labmlai
GitHub Repository: labmlai/annotated_deep_learning_paper_implementations
Path: blob/master/translate_cache/neox/utils/cache.si.json
4923 views
1
{
2
"<h1>Cache for Intermediate Activations</h1>\n<p>During inference the model outputs token by token. We use this simple cache to store key&#x27;s and value&#x27;s attention layers, so that we don&#x27;t have to recompute them for previous tokens.</p>\n": "<h1>\u0d85\u0dad\u0dbb\u0db8\u0dd0\u0daf\u0dd2\u0dc3\u0d9a\u0dca\u0dbb\u0dd3\u0dba \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dca \u0dc3\u0db3\u0dc4\u0dcf \u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2\u0dba</h1>\n<p>\u0d85\u0db1\u0dd4\u0db8\u0dcf\u0db1\u0dba\u0d85\u0dad\u0dbb\u0dad\u0dd4\u0dbb \u0d86\u0daf\u0dbb\u0dca\u0dc1 \u0da7\u0ddd\u0d9a\u0db1\u0dba \u0db8\u0d9f\u0dd2\u0db1\u0dca \u0da7\u0ddd\u0d9a\u0db1\u0dba \u0db4\u0dca\u0dbb\u0dad\u0dd2\u0daf\u0dcf\u0db1\u0dba \u0d9a\u0dbb\u0dba\u0dd2. \u0dba\u0dad\u0dd4\u0dbb\u0dda \u0dc3\u0dc4 \u0dc0\u0da7\u0dd2\u0db1\u0dcf\u0d9a\u0db8\u0dda \u0d85\u0dc0\u0db0\u0dcf\u0db1\u0dba \u0dc3\u0dca\u0dae\u0dbb \u0d9c\u0db6\u0da9\u0dcf \u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0dc3\u0db3\u0dc4\u0dcf \u0d85\u0db4\u0dd2 \u0db8\u0dd9\u0db8 \u0dc3\u0dbb\u0dbd \u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2\u0dba \u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0d9a\u0dbb\u0db8\u0dd4, \u0d91\u0dc0\u0dd2\u0da7 \u0db4\u0dd9\u0dbb \u0da7\u0ddd\u0d9a\u0db1 \u0dc3\u0db3\u0dc4\u0dcf \u0d92\u0dc0\u0dcf \u0db1\u0dd0\u0dc0\u0dad \u0d9c\u0dab\u0db1\u0dba \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0da7 \u0d85\u0db4\u0da7 \u0d85\u0dc0\u0dc1\u0dca\u0dba \u0db1\u0ddc\u0dc0\u0dda. </p>\n",
3
"<h2>Cache</h2>\n<p>This maintains a key-value cache and queues push values and pop them in the same order. The queues are useful since we have multiple attention layers.</p>\n": "<h2>\u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2\u0dba</h2>\n<p>\u0db8\u0dd9\u0dba\u0db4\u0dca\u0dbb\u0db0\u0dcf\u0db1 \u0dc0\u0da7\u0dd2\u0db1\u0dcf\u0d9a\u0db8\u0d9a\u0dca \u0dc3\u0dc4\u0dd2\u0dad \u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2\u0dba\u0d9a\u0dca \u0db4\u0dc0\u0dad\u0dca\u0dc0\u0dcf \u0d9c\u0dd9\u0db1 \u0dba\u0db1 \u0d85\u0dad\u0dbb \u0db4\u0ddd\u0dbd\u0dd2\u0db8\u0dca \u0d85\u0d9c\u0dba\u0db1\u0dca \u0dad\u0dbd\u0dca\u0dbd\u0dd4 \u0d9a\u0dbb \u0d92\u0dc0\u0dcf \u0d91\u0d9a\u0db8 \u0d85\u0db1\u0dd4\u0db4\u0dd2\u0dc5\u0dd2\u0dc0\u0dd9\u0dbd\u0d9a\u0da7 \u0db4\u0ddc\u0db4\u0dca \u0d9a\u0dbb\u0dba\u0dd2. \u0d85\u0db4\u0da7 \u0db6\u0dc4\u0dd4 \u0d85\u0dc0\u0db0\u0dcf\u0db1\u0dba \u0dc3\u0dca\u0dae\u0dbb \u0d87\u0dad\u0dd2 \u0db6\u0dd0\u0dc0\u0dd2\u0db1\u0dca \u0db4\u0ddd\u0dbd\u0dd2\u0db8\u0dca \u0db4\u0dca\u0dbb\u0dba\u0ddd\u0da2\u0db1\u0dc0\u0dad\u0dca \u0dc0\u0dda. </p>\n",
4
"<h3>Cache a value</h3>\n<ul><li><span translate=no>_^_0_^_</span> is the name of the value to be cached </li>\n<li><span translate=no>_^_1_^_</span> is the value</li></ul>\n": "<h3>\u0dc0\u0da7\u0dd2\u0db1\u0dcf\u0d9a\u0db8\u0d9a\u0dca\u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2\u0dba</h3>\n<ul><li><span translate=no>_^_0_^_</span> \u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2 \u0d9a\u0dc5 \u0dba\u0dd4\u0dad\u0dd4 \u0dc0\u0da7\u0dd2\u0db1\u0dcf\u0d9a\u0db8\u0dda \u0db1\u0db8\u0dba\u0dd2 </li>\n<li><span translate=no>_^_1_^_</span> \u0dc0\u0da7\u0dd2\u0db1\u0dcf\u0d9a\u0db8 \u0dc0\u0dda</li></ul>\n",
5
"<h3>Clear a cache value</h3>\n<ul><li><span translate=no>_^_0_^_</span> is the name used when caching</li></ul>\n": "<h3>\u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2\u0d85\u0d9c\u0dba \u0d89\u0dc0\u0dad\u0dca \u0d9a\u0dbb\u0db1\u0dca\u0db1</h3>\n<ul><li><span translate=no>_^_0_^_</span> \u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dda\u0daf\u0dd3 \u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0d9a\u0dbb\u0db1 \u0db1\u0db8\u0dba\u0dd2</li></ul>\n",
6
"<h3>Clear cache</h3>\n": "<h3>\u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2\u0dba\u0d89\u0dc0\u0dad\u0dca \u0d9a\u0dbb\u0db1\u0dca\u0db1</h3>\n",
7
"<h3>Get the cache instance</h3>\n<ul><p><em>Returns</em> the cache instance</p></ul>\n": "<h3>\u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2\u0d8b\u0daf\u0dcf\u0dc4\u0dbb\u0dab\u0dba\u0d9a\u0dca \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1</h3>\n<ul><p>\u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2\u0d85\u0dc0\u0dc3\u0dca\u0dae\u0dcf\u0dc0<em>\u0d86\u0db4\u0dc3\u0dd4 \u0dbd\u0db6\u0dcf \u0daf\u0dd9\u0dba\u0dd2</em> </p></ul>\n",
8
"<h3>Pop from a queue</h3>\n<ul><li><span translate=no>_^_0_^_</span> is the name of the queue </li>\n<p><em>Returns</em> the value</p></ul>\n": "<h3>\u0db4\u0ddd\u0dbd\u0dd2\u0db8\u0dda\u0dc3\u0dd2\u0da7 \u0db4\u0ddc\u0db4\u0dca</h3>\n<ul><li><span translate=no>_^_0_^_</span> \u0db4\u0ddd\u0dbd\u0dd2\u0db8\u0dda \u0db1\u0db8 </li>\n<p>\u0dc0\u0da7\u0dd2\u0db1\u0dcf\u0d9a\u0db8<em>\u0db1\u0dd0\u0dc0\u0dad \u0dbd\u0db6\u0dcf \u0daf\u0dd9\u0dba\u0dd2</em> </p></ul>\n",
9
"<h3>Push a value to a queue</h3>\n<ul><li><span translate=no>_^_0_^_</span> is the name of the queue </li>\n<li><span translate=no>_^_1_^_</span> is the value to be pushed</li></ul>\n": "<h3>\u0db4\u0ddd\u0dbd\u0dd2\u0db8\u0d9a\u0da7\u0dc0\u0da7\u0dd2\u0db1\u0dcf\u0d9a\u0db8\u0d9a\u0dca \u0dad\u0dbd\u0dca\u0dbd\u0dd4 \u0d9a\u0dbb\u0db1\u0dca\u0db1</h3>\n<ul><li><span translate=no>_^_0_^_</span> \u0db4\u0ddd\u0dbd\u0dd2\u0db8\u0dda \u0db1\u0db8 </li>\n<li><span translate=no>_^_1_^_</span> \u0dad\u0dbd\u0dca\u0dbd\u0dd4 \u0d9a\u0dc5 \u0dba\u0dd4\u0dad\u0dd4 \u0dc0\u0da7\u0dd2\u0db1\u0dcf\u0d9a\u0db8 \u0dc0\u0dda</li></ul>\n",
10
"<h3>Retrieve a value from cache</h3>\n<ul><li><span translate=no>_^_0_^_</span> is the name used when caching </li>\n<li><span translate=no>_^_1_^_</span> is the default value if the cache is empty </li>\n<p><em>Returns</em> the cached value</p></ul>\n": "<h3>\u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2\u0dc0\u0dbd\u0dd2\u0db1\u0dca\u0dc0\u0da7\u0dd2\u0db1\u0dcf\u0d9a\u0db8\u0d9a\u0dca \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1</h3>\n<ul><li><span translate=no>_^_0_^_</span> \u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dda\u0daf\u0dd3 \u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0d9a\u0dbb\u0db1 \u0db1\u0db8\u0dba\u0dd2 </li>\n<li><span translate=no>_^_1_^_</span> \u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2\u0dba \u0dc4\u0dd2\u0dc3\u0dca \u0db1\u0db8\u0dca \u0db4\u0dd9\u0dbb\u0db1\u0dd2\u0db8\u0dd2 \u0d85\u0d9c\u0dba \u0dc0\u0dda </li>\n<p>\u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2\u0d85\u0d9c\u0dba<em>\u0db1\u0dd0\u0dc0\u0dad \u0dbd\u0db6\u0dcf \u0daf\u0dd9\u0dba\u0dd2</em> </p></ul>\n",
11
"<h3>Return the size of the queue</h3>\n<ul><li><span translate=no>_^_0_^_</span> is the name of the queue </li>\n<p><em>Returns</em> size of the queue if exists else None</p></ul>\n": "<h3>\u0db4\u0ddd\u0dbd\u0dd2\u0db8\u0dda\u0db4\u0dca\u0dbb\u0db8\u0dcf\u0dab\u0dba \u0d86\u0db4\u0dc3\u0dd4 \u0daf\u0dd9\u0db1\u0dca\u0db1</h3>\n<ul><li><span translate=no>_^_0_^_</span> \u0db4\u0ddd\u0dbd\u0dd2\u0db8\u0dda \u0db1\u0db8 </li>\n</ul><p>\u0db4\u0ddd\u0dbd\u0dd2\u0db8\u0dda<em>\u0db4\u0dca\u0dbb\u0dad\u0dd2\u0dbd\u0dcf\u0db7</em> \u0db4\u0dca\u0dbb\u0db8\u0dcf\u0dab\u0dba \u0dc0\u0dd9\u0db1\u0dad\u0dca \u0d9a\u0dd2\u0dc3\u0dd2\u0dc0\u0d9a\u0dca \u0dad\u0dd2\u0db6\u0dda \u0db1\u0db8\u0dca \u0db1\u0dd0\u0dad</p>\n",
12
"<p>Create an empty queue if it&#x27;s not present </p>\n": "<p>\u0d91\u0dba\u0db1\u0ddc\u0db8\u0dd0\u0dad\u0dd2 \u0db1\u0db8\u0dca \u0dc4\u0dd2\u0dc3\u0dca \u0db4\u0ddd\u0dbd\u0dd2\u0db8\u0d9a\u0dca \u0dc3\u0dcf\u0daf\u0db1\u0dca\u0db1 </p>\n",
13
"<p>Push to the queue </p>\n": "<p>\u0db4\u0ddd\u0dbd\u0dd2\u0db8\u0da7\u0dad\u0dbd\u0dca\u0dbd\u0dd4 \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
14
"<p>Singleton for cache </p>\n": "<p>\u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2\u0dc3\u0db3\u0dc4\u0dcf \u0dc3\u0dd2\u0d82\u0d9c\u0dbd\u0dca\u0da7\u0db1\u0dca </p>\n",
15
"Cache for Intermediate Activations": "\u0d85\u0dad\u0dbb\u0db8\u0dd0\u0daf\u0dd2 \u0dc3\u0d9a\u0dca\u0dbb\u0dd3\u0dba \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dca \u0dc3\u0db3\u0dc4\u0dcf \u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2\u0dba",
16
"Cache for intermediate activations for faster inference.": "\u0dc0\u0dda\u0d9c\u0dc0\u0dad\u0dca \u0d85\u0db1\u0dd4\u0db8\u0dcf\u0db1\u0dba \u0dc3\u0db3\u0dc4\u0dcf \u0d85\u0dad\u0dbb\u0db8\u0dd0\u0daf\u0dd2 \u0dc3\u0d9a\u0dca\u0dbb\u0dd3\u0dba \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dca \u0dc3\u0db3\u0dc4\u0dcf \u0dc4\u0dd0\u0db9\u0dd2\u0dbd\u0dd2."
17
}
18