Path: blob/master/translate_cache/sampling/top_k.si.json
4932 views
{1"<h1>Top-k Sampling</h1>\n<p>Here we first pick the top-k tokens from the distribution of logits, and then sample from them.</p>\n<p>Here's an <a href=\"experiment.html\">experiment</a> that uses these sampling techniques.</p>\n": "<h1>\u0d89\u0dc4\u0dc5-K\u0db1\u0dd2\u0dba\u0dd0\u0daf\u0dd3\u0db8\u0dca</h1>\n<p>\u0db8\u0dd9\u0db1\u0dca\u0db1\u0d85\u0db4\u0dd2 \u0db4\u0dc5\u0db8\u0dd4\u0dc0 \u0db4\u0dd2\u0dc0\u0dd2\u0dc3\u0dd4\u0db8\u0dca \u0db6\u0dd9\u0daf\u0dcf \u0dc4\u0dd0\u0dbb\u0dd3\u0db8\u0dd9\u0db1\u0dca \u0d89\u0dc4\u0dc5\u0db8 \u0d9a\u0dda \u0da7\u0ddd\u0d9a\u0db1 \u0dad\u0ddd\u0dbb\u0dcf\u0d9c\u0dd9\u0db1 \u0d92\u0dc0\u0dcf\u0dba\u0dd2\u0db1\u0dca \u0dc3\u0dcf\u0db8\u0dca\u0db4\u0dbd \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dd2\u0db8\u0dd4. </p>\n<p>\u0db8\u0dd9\u0db1\u0dca\u0db1\u0db8\u0dd9\u0db8 \u0db1\u0dd2\u0dba\u0dd0\u0daf\u0dd2 \u0dc1\u0dd2\u0dbd\u0dca\u0db4\u0dd3\u0dba \u0d9a\u0dca\u0dbb\u0db8 \u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0d9a\u0dbb\u0db1 <a href=\"experiment.html\">\u0d85\u0dad\u0dca\u0dc4\u0daf\u0dcf \u0db6\u0dd0\u0dbd\u0dd3\u0db8\u0d9a\u0dca</a> . </p>\n",2"<h2>Top-k Sampler</h2>\n": "<h2>\u0d89\u0dc4\u0dc5-K\u0db1\u0dd2\u0dba\u0dd0\u0daf\u0dd2</h2>\n",3"<p> Sample from logits</p>\n": "<p> \u0db4\u0dd2\u0dc0\u0dd2\u0dc3\u0dd4\u0db8\u0dca\u0dc0\u0dbd\u0dd2\u0db1\u0dca \u0db1\u0dd2\u0dba\u0dd0\u0daf\u0dd2\u0dba</p>\n",4"<p>New logits filled with <span translate=no>_^_0_^_</span>; i.e. zero probability </p>\n": "<p>\u0db1\u0dc0\u0db4\u0dd2\u0dc0\u0dd2\u0dc3\u0dd4\u0db8\u0dca \u0db4\u0dd2\u0dbb\u0dd3 \u0d87\u0dad <span translate=no>_^_0_^_</span>; i.e. \u0dc1\u0dd4\u0db1\u0dca\u0dba \u0dc3\u0db8\u0dca\u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf\u0dc0 </p>\n",5"<p>Pick the largest <span translate=no>_^_0_^_</span> logits and their indices </p>\n": "<p>\u0dc0\u0dd2\u0dc1\u0dcf\u0dbd\u0dad\u0db8 <span translate=no>_^_0_^_</span> \u0db4\u0dd2\u0dc0\u0dd2\u0dc3\u0dd4\u0db8\u0dca \u0dc3\u0dc4 \u0d92\u0dc0\u0dcf\u0dba\u0dda \u0daf\u0dbb\u0dca\u0dc1\u0d9a \u0dad\u0ddd\u0dbb\u0db1\u0dca\u0db1 </p>\n",6"<p>Sample from the top-k logits with the specified sampler. </p>\n": "<p>\u0db1\u0dd2\u0dc1\u0dca\u0da0\u0dd2\u0dad\u0db1\u0dd2\u0dba\u0dd0\u0daf\u0dd2\u0dba \u0dc3\u0db8\u0d9f \u0d89\u0dc4\u0dc5-k \u0db4\u0dd2\u0dc0\u0dd2\u0dc3\u0dd4\u0db8\u0dca \u0dc0\u0dbd\u0dd2\u0db1\u0dca \u0db1\u0dd2\u0dba\u0dd0\u0daf\u0dd2\u0dba. </p>\n",7"<p>Set the values of the top-k selected indices to actual logits. Logits of other tokens remain <span translate=no>_^_0_^_</span> </p>\n": "<p>Top-k\u0dad\u0ddd\u0dbb\u0dcf\u0d9c\u0dad\u0dca \u0daf\u0dbb\u0dca\u0dc1\u0d9a\u0dc0\u0dbd \u0d85\u0d9c\u0dba\u0db1\u0dca \u0dc3\u0dd0\u0db6\u0dd1 \u0db4\u0dd2\u0dc0\u0dd2\u0dc3\u0dd4\u0db8\u0dca \u0dc0\u0dbd\u0da7 \u0dc3\u0d9a\u0dc3\u0db1\u0dca\u0db1. \u0dc0\u0dd9\u0db1\u0dad\u0dca \u0da7\u0ddd\u0d9a\u0db1 \u0dc0\u0dbd \u0db4\u0dd2\u0dc0\u0dd2\u0dc3\u0dd4\u0db8\u0dca \u0d89\u0dad\u0dd2\u0dbb\u0dd2\u0dc0 \u0db4\u0dc0\u0dad\u0dd3 <span translate=no>_^_0_^_</span> </p>\n",8"<ul><li><span translate=no>_^_0_^_</span> is the number of tokens to pick </li>\n<li><span translate=no>_^_1_^_</span> is the sampler to use for the top-k tokens</li></ul>\n<p><span translate=no>_^_2_^_</span> can be any sampler that takes a logits tensor as input and returns a token tensor; e.g. <a href=\"temperature.html\">`TemperatureSampler'</a>.</p>\n": "<ul><li><span translate=no>_^_0_^_</span> \u0dad\u0ddd\u0dbb\u0dcf \u0d9c\u0dd0\u0db1\u0dd3\u0db8\u0da7 \u0da7\u0ddd\u0d9a\u0db1 \u0d9c\u0dab\u0db1 \u0dc0\u0dda </li>\n</ul><li><span translate=no>_^_1_^_</span> \u0d89\u0dc4\u0dc5-k \u0da7\u0ddd\u0d9a\u0db1 \u0dc3\u0db3\u0dc4\u0dcf \u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0da7 \u0db1\u0dd2\u0dba\u0dd0\u0daf\u0dd2\u0d9a\u0dbb\u0dd4 \u0dc0\u0dda</li>\n<p><span translate=no>_^_2_^_</span> \u0db4\u0dd2\u0dc0\u0dd2\u0dc3\u0dd4\u0db8\u0dca \u0da7\u0dd9\u0db1\u0dca\u0dc3\u0dbb\u0dba\u0d9a\u0dca \u0d86\u0daf\u0dcf\u0db1 \u0dbd\u0dd9\u0dc3 \u0d9c\u0dd9\u0db1 \u0da7\u0ddd\u0d9a\u0db1\u0dca \u0da7\u0dd9\u0db1\u0dca\u0dc3\u0dbb\u0dba\u0d9a\u0dca \u0db1\u0dd0\u0dc0\u0dad \u0dbd\u0db6\u0dcf \u0daf\u0dd9\u0db1 \u0d95\u0db1\u0dd1\u0db8 \u0db1\u0dd2\u0dba\u0dd0\u0daf\u0dd2\u0dba\u0d9a \u0dc0\u0dd2\u0dba \u0dc4\u0dd0\u0d9a\u0dd2\u0dba; \u0d8b\u0daf\u0dcf: <a href=\"temperature.html\">`\u0d8b\u0dc2\u0dca\u0dab\u0dad\u0dca\u0dc0 \u0dc3\u0dcf\u0db8\u0dca\u0db4\u0dbd\u0dba\u0d9a\u0dca'</a>. </p>\n",9"A PyTorch implementation of top-k sampling from language models.": "\u0db7\u0dcf\u0dc2\u0dcf \u0d86\u0d9a\u0dd8\u0dad\u0dd2 \u0dc0\u0dbd\u0dd2\u0db1\u0dca \u0d89\u0dc4\u0dc5 \u0d9a\u0dda \u0db1\u0dd2\u0dba\u0dd0\u0daf\u0dd3\u0db8\u0dca PyTorch \u0d9a\u0dca\u0dbb\u0dd2\u0dba\u0dcf\u0dad\u0dca\u0db8\u0d9a \u0d9a\u0dd2\u0dbb\u0dd3\u0db8.",10"Top-k Sampling": "\u0d89\u0dc4\u0dc5-K \u0db1\u0dd2\u0dba\u0dd0\u0daf\u0dd3\u0db8\u0dca"11}1213