Path: blob/master/translate_cache/experiments/arithmetic_dataset.si.json
4923 views
{1"<h2>Arithmetic Dataset</h2>\n<p>This creates arithmetic addition problems and solutions with workings. We've only implemented addition so far.</p>\n<p>It's based on a character level tokenization.</p>\n": "<h2>\u0d85\u0d82\u0d9a\u0d9c\u0dab\u0dd2\u0dad \u0daf\u0dad\u0dca\u0dad \u0d9a\u0da7\u0dca\u0da7\u0dbd\u0dba</h2>\n<p>\u0db8\u0dd9\u0dba\u0d85\u0d82\u0d9a \u0d9c\u0dab\u0dd2\u0dad\u0db8\u0dba \u0d91\u0d9a\u0dad\u0dd4 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dda \u0d9c\u0dd0\u0da7\u0dc5\u0dd4 \u0dc3\u0dc4 \u0d9a\u0dca\u0dbb\u0dd2\u0dba\u0dcf\u0d9a\u0dcf\u0dbb\u0dd2\u0dad\u0dca\u0dc0\u0dba \u0dc3\u0db8\u0d9f \u0dc0\u0dd2\u0dc3\u0db3\u0dd4\u0db8\u0dca \u0db1\u0dd2\u0dbb\u0dca\u0db8\u0dcf\u0dab\u0dba \u0d9a\u0dbb\u0dba\u0dd2. \u0d85\u0db4\u0dd2 \u0db8\u0dd9\u0dad\u0dd9\u0d9a\u0dca \u0d9a\u0dca\u0dbb\u0dd2\u0dba\u0dcf\u0dad\u0dca\u0db8\u0d9a \u0d9a\u0dbb \u0d87\u0dad\u0dca\u0dad\u0dda \u0d91\u0d9a\u0dad\u0dd4 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0db4\u0db8\u0dab\u0dd2. </p>\n<p>\u0d91\u0dba\u0db4\u0daf\u0db1\u0db8\u0dca \u0dc0\u0dd3 \u0d87\u0dad\u0dca\u0dad\u0dda \u0da0\u0dbb\u0dd2\u0dad \u0db8\u0da7\u0dca\u0da7\u0db8\u0dda \u0da7\u0ddd\u0d9a\u0db1\u0dd3\u0d9a\u0dbb\u0dab\u0dba \u0db8\u0dad \u0dba. </p>\n",2"<h2>Arithmetic Task Experiment Configurations</h2>\n": "<h2>\u0d85\u0d82\u0d9a\u0d9c\u0dab\u0dd2\u0dad \u0d9a\u0dcf\u0dbb\u0dca\u0dba \u0d85\u0dad\u0dca\u0dc4\u0daf\u0dcf \u0db6\u0dd0\u0dbd\u0dd3\u0db8\u0dda \u0dc0\u0dd2\u0db1\u0dca\u0dba\u0dcf\u0dc3\u0dba\u0db1\u0dca</h2>\n",3"<h3>Evaluation</h3>\n<p>We use the sampling function to evaluate the model on a set of problems</p>\n": "<h3>\u0d87\u0d9c\u0dba\u0dd3\u0db8</h3>\n<p>\u0d9c\u0dd0\u0da7\u0dc5\u0dd4\u0dc3\u0db8\u0dd6\u0dc4\u0dba\u0d9a\u0dca \u0db8\u0dad \u0d86\u0d9a\u0dd8\u0dad\u0dd2\u0dba \u0d87\u0d9c\u0dba\u0dd3\u0db8 \u0dc3\u0db3\u0dc4\u0dcf \u0d85\u0db4\u0dd2 \u0db1\u0dd2\u0dba\u0dd0\u0daf\u0dd2 \u0dc1\u0dca\u0dbb\u0dd2\u0dad\u0dba \u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0d9a\u0dbb\u0db8\u0dd4</p>\n",4"<p> </p>\n": "<p> </p>\n",5"<p> Code to test generated problems</p>\n": "<p> \u0da2\u0db1\u0db1\u0dba\u0d9a\u0dbb\u0db1 \u0dbd\u0daf \u0d9c\u0dd0\u0da7\u0dc5\u0dd4 \u0db4\u0dbb\u0dd3\u0d9a\u0dca\u0dc2\u0dcf \u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0dc3\u0db3\u0dc4\u0dcf \u0d9a\u0dda\u0dad\u0dba</p>\n",6"<p> Decode a list of token ids</p>\n": "<p> \u0da7\u0ddd\u0d9a\u0db1\u0dca\u0dc4\u0dd0\u0db3\u0dd4\u0db1\u0dd4\u0db8\u0dca\u0db4\u0dad\u0dca \u0dbd\u0dd0\u0dba\u0dd2\u0dc3\u0dca\u0dad\u0dd4\u0dc0\u0d9a\u0dca \u0dc0\u0dd2\u0d9a\u0dda\u0dad\u0db1\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1</p>\n",7"<p> Encode a given string</p>\n": "<p> \u0daf\u0dd3\u0d87\u0dad\u0dd2 \u0db1\u0dd6\u0dbd\u0d9a\u0dca \u0d9a\u0dda\u0dad\u0db1\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1</p>\n",8"<p> Generate multiple problems and pack them into a sequence.</p>\n": "<p> \u0db6\u0dc4\u0dd4\u0d9c\u0dd0\u0da7\u0dc5\u0dd4 \u0da2\u0db1\u0db1\u0dba \u0d9a\u0dbb \u0d92\u0dc0\u0dcf \u0d85\u0db1\u0dd4\u0db4\u0dd2\u0dc5\u0dd2\u0dc0\u0dd9\u0dbd\u0d9a\u0da7 \u0d87\u0dc3\u0dd4\u0dbb\u0dd4\u0db8\u0dca \u0d9a\u0dbb\u0db1\u0dca\u0db1. </p>\n",9"<p> Generates an integer with <span translate=no>_^_0_^_</span> number of digits</p>\n": "<p> \u0d89\u0dbd\u0d9a\u0dca\u0d9a\u0db8\u0dca <span translate=no>_^_0_^_</span> \u0d9c\u0dab\u0db1 \u0dc3\u0dc4\u0dd2\u0dad \u0db4\u0dd6\u0dbb\u0dca\u0dab \u0dc3\u0d82\u0d9b\u0dca\u0dba\u0dcf\u0dc0\u0d9a\u0dca \u0da2\u0db1\u0db1\u0dba \u0d9a\u0dbb\u0dba\u0dd2</p>\n",10"<p> Generates the workings for <span translate=no>_^_0_^_</span>. For example for <span translate=no>_^_1_^_</span> it generates <span translate=no>_^_2_^_</span>.</p>\n": "<p> \u0dc3\u0db3\u0dc4\u0dcf\u0d9a\u0dca\u0dbb\u0dd2\u0dba\u0dcf\u0d9a\u0dcf\u0dbb\u0dd2\u0dad\u0dca\u0dc0\u0dba \u0da2\u0db1\u0db1\u0dba \u0d9a\u0dbb\u0dba\u0dd2 <span translate=no>_^_0_^_</span>. \u0d8b\u0daf\u0dcf\u0dc4\u0dbb\u0dab\u0dba\u0d9a\u0dca \u0dbd\u0dd9\u0dc3 <span translate=no>_^_1_^_</span> \u0d91\u0dba \u0da2\u0db1\u0db1\u0dba \u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0dc3\u0db3\u0dc4\u0dcf <span translate=no>_^_2_^_</span>. </p>\n",11"<p> Get a input and target pair for auto-regressive modelling</p>\n": "<p> \u0dc3\u0dca\u0dc0\u0dba\u0d82\u0d9a\u0dca\u0dbb\u0dd3\u0dba\u0db4\u0dca\u0dbb\u0dad\u0dd2\u0d9c\u0dcf\u0db8\u0dd3 \u0d86\u0d9a\u0dd8\u0dad\u0dd2 \u0db1\u0dd2\u0dbb\u0dca\u0db8\u0dcf\u0dab\u0dba \u0dc3\u0db3\u0dc4\u0dcf \u0d86\u0daf\u0dcf\u0db1 \u0dc3\u0dc4 \u0d89\u0dbd\u0d9a\u0dca\u0d9a \u0dba\u0dd4\u0d9c\u0dbd\u0dba\u0d9a\u0dca \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1</p>\n",12"<p> Get arithmetic problem and answer. This is used for evaluation.</p>\n": "<p> \u0d85\u0d82\u0d9a\u0d9c\u0dab\u0dd2\u0dad\u0db8\u0dba \u0d9c\u0dd0\u0da7\u0dc5\u0dd4\u0dc0 \u0dc3\u0dc4 \u0db4\u0dd2\u0dc5\u0dd2\u0dad\u0dd4\u0dbb\u0dd4 \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1. \u0db8\u0dd9\u0dba \u0d87\u0d9c\u0dba\u0dd3\u0db8 \u0dc3\u0db3\u0dc4\u0dcf \u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0dc0\u0dda. </p>\n",13"<p> Number of sequences per epoch</p>\n": "<p> \u0d91\u0db4\u0ddd\u0da0\u0dca\u0d91\u0d9a\u0d9a\u0da7 \u0d85\u0db1\u0dd4\u0db4\u0dd2\u0dc5\u0dd2\u0dc0\u0dd9\u0dbd\u0dc0\u0dbd\u0dca \u0d9c\u0dab\u0db1</p>\n",14"<p> Training data loader</p>\n": "<p> \u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4\u0daf\u0dad\u0dca\u0dad \u0db4\u0dd0\u0da7\u0dc0\u0dd4\u0db8</p>\n",15"<p><em>This is based on code by <a href=\"https://twitter.com/gharik\">Georges Harik (@gharik)</a>.</em></p>\n": "<p><em>\u0db8\u0dd9\u0dba <a href=\"https://twitter.com/gharik\">\u0da2\u0ddd\u0dbb\u0dca\u0da2\u0dc3\u0dca \u0dc4\u0dcf\u0dbb\u0dd2\u0d9a\u0dca (@gharik)</a>\u0dc0\u0dd2\u0dc3\u0dd2\u0db1\u0dca \u0d9a\u0dbb\u0db1 \u0dbd\u0daf \u0d9a\u0dda\u0dad\u0dba \u0db8\u0dad \u0db4\u0daf\u0db1\u0db8\u0dca \u0dc0\u0dda. </em></p>\n",16"<p>Add the next token to the input </p>\n": "<p>\u0d86\u0daf\u0dcf\u0db1\u0dba\u0da7\u0d8a\u0dc5\u0d9f \u0da7\u0ddd\u0d9a\u0db1\u0dba \u0d91\u0d9a\u0dca \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",17"<p>Character to token id </p>\n": "<p>\u0d85\u0d9a\u0dca\u0dc2\u0dbb\u0da7\u0ddd\u0d9a\u0db1\u0dca \u0dc4\u0dd0\u0db3\u0dd4\u0db1\u0dd4\u0db8\u0dca\u0db4\u0dad\u0da7 </p>\n",18"<p>Collect the problems only </p>\n": "<p>\u0d9c\u0dd0\u0da7\u0dc5\u0dd4\u0db4\u0db8\u0dab\u0d9a\u0dca \u0d91\u0d9a\u0dad\u0dd4 \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",19"<p>Count the number of correct answers </p>\n": "<p>\u0db1\u0dd2\u0dc0\u0dd0\u0dbb\u0daf\u0dd2\u0db4\u0dd2\u0dc5\u0dd2\u0dad\u0dd4\u0dbb\u0dd4 \u0d9c\u0dab\u0db1 \u0d9c\u0dab\u0db1\u0dca \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",20"<p>Create a dataset to generate problems </p>\n": "<p>\u0d9c\u0dd0\u0da7\u0dc5\u0dd4\u0da2\u0db1\u0db1\u0dba \u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0dc3\u0db3\u0dc4\u0dcf \u0daf\u0dad\u0dca\u0dad \u0d9a\u0da7\u0dca\u0da7\u0dbd\u0dba\u0d9a\u0dca \u0dc3\u0dcf\u0daf\u0db1\u0dca\u0db1 </p>\n",21"<p>Create a tensor with only the initial token </p>\n": "<p>\u0d86\u0dbb\u0db8\u0dca\u0db7\u0d9a\u0da7\u0ddd\u0d9a\u0db1\u0dba \u0db4\u0db8\u0dab\u0d9a\u0dca \u0dc3\u0dc4\u0dd2\u0dad \u0da7\u0dd9\u0db1\u0dca\u0dc3\u0dbb\u0dba\u0d9a\u0dca \u0dc3\u0dcf\u0daf\u0db1\u0dca\u0db1 </p>\n",22"<p>Discard everything after the answer in the results </p>\n": "<p>\u0db4\u0dca\u0dbb\u0dad\u0dd2\u0db5\u0dbd\u0dc0\u0dbd\u0db4\u0dd2\u0dc5\u0dd2\u0dad\u0dd4\u0dbb\u0dd9\u0db1\u0dca \u0db4\u0dc3\u0dd4 \u0dc3\u0dd2\u0dba\u0dbd\u0dca\u0dbd \u0d89\u0dc0\u0dad\u0dbd\u0db1\u0dca\u0db1 </p>\n",23"<p>Find which sequences have finished </p>\n": "<p>\u0d9a\u0dd4\u0db8\u0db1\u0d85\u0db1\u0dd4\u0db4\u0dd2\u0dc5\u0dd2\u0dc0\u0dd9\u0dbd\u0dc0\u0dbd\u0dca \u0d85\u0dc0\u0dc3\u0db1\u0dca \u0d9a\u0dbb \u0d87\u0dad\u0dca\u0daf\u0dd0\u0dba\u0dd2 \u0dc3\u0ddc\u0dba\u0dcf \u0d9c\u0db1\u0dca\u0db1 </p>\n",24"<p>Get a set of problems and answers </p>\n": "<p>\u0d9c\u0dd0\u0da7\u0dc5\u0dd4\u0dc3\u0dc4 \u0db4\u0dd2\u0dc5\u0dd2\u0dad\u0dd4\u0dbb\u0dd4 \u0dc3\u0db8\u0dd6\u0dc4\u0dba\u0d9a\u0dca \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1 </p>\n",25"<p>Get the answers </p>\n": "<p>\u0db4\u0dd2\u0dc5\u0dd2\u0dad\u0dd4\u0dbb\u0dd4\u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1 </p>\n",26"<p>Get the model output </p>\n": "<p>\u0d86\u0daf\u0dbb\u0dca\u0dc1\u0db4\u0dca\u0dbb\u0dad\u0dd2\u0daf\u0dcf\u0db1\u0dba \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1 </p>\n",27"<p>Get the model prediction (greedy) </p>\n": "<p>\u0d86\u0daf\u0dbb\u0dca\u0dc1\u0d85\u0db1\u0dcf\u0dc0\u0dd0\u0d9a\u0dd2\u0dba \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1 (\u0d9a\u0dd1\u0daf\u0dbb) </p>\n",28"<p>Get the sampled results </p>\n": "<p>\u0db1\u0dd2\u0dba\u0dd0\u0daf\u0dd2\u0db4\u0dca\u0dbb\u0dad\u0dd2\u0db5\u0dbd \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1 </p>\n",29"<p>If all the sequences have completed we skip this </p>\n": "<p>\u0dc3\u0dd2\u0dba\u0dbd\u0dd4\u0db8\u0d85\u0db1\u0dd4\u0d9a\u0dca\u0dbb\u0db8\u0dba\u0db1\u0dca \u0dc3\u0db8\u0dca\u0db4\u0dd6\u0dbb\u0dca\u0dab \u0d9a\u0dbb \u0d87\u0dad\u0dca\u0db1\u0db8\u0dca \u0d85\u0db4\u0dd2 \u0db8\u0dd9\u0dba \u0db8\u0d9f \u0dc4\u0dbb\u0dd2\u0db8\u0dd4 </p>\n",30"<p>Log a sample </p>\n": "<p>\u0db1\u0dd2\u0dba\u0dd0\u0daf\u0dd2\u0dba\u0d9a\u0dca\u0dbd\u0ddc\u0d9c\u0dca \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",31"<p>Log the score </p>\n": "<p>\u0dbd\u0d9a\u0dd4\u0dab\u0dd4\u0dbd\u0ddc\u0d9c\u0dca \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",32"<p>Make a problem with a pre_explanation or not</p>\n<p>Creates an arithmetic addition problem with workings and answer.</p>\n": "<p>\u0db4\u0dd6\u0dbb\u0dca\u0dc0\u0db4\u0dd0\u0dc4\u0dd0\u0daf\u0dd2\u0dbd\u0dd2 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0d9a\u0dca \u0dc3\u0db8\u0d9f \u0d9c\u0dd0\u0da7\u0dc5\u0dd4\u0dc0\u0d9a\u0dca \u0d87\u0dad\u0dd2 \u0d9a\u0dbb\u0db1\u0dca\u0db1 \u0dc4\u0ddd \u0db1\u0dd0\u0dad</p>\n<p>workings\u0dc4\u0dcf \u0db4\u0dd2\u0dc5\u0dd2\u0dad\u0dd4\u0dbb\u0dd4 \u0dc3\u0db8\u0d9c \u0d85\u0d82\u0d9a \u0d9c\u0dab\u0dd2\u0dad\u0db8\u0dba \u0d91\u0d9a\u0dad\u0dd4 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dda \u0d9c\u0dd0\u0da7\u0dbd\u0dd4\u0dc0\u0d9a\u0dca \u0db1\u0dd2\u0dbb\u0dca\u0db8\u0dcf\u0dab\u0dba \u0d9a\u0dbb\u0dba\u0dd2. </p>\n",33"<p>Maximum number of digits per operand integer </p>\n": "<p>\u0d9a\u0dca\u0dbb\u0dd2\u0dba\u0dcf\u0d9a\u0dcf\u0dbb\u0dd3\u0db4\u0dd6\u0dbb\u0dca\u0dab \u0dc3\u0d82\u0d9b\u0dca\u0dba\u0dcf\u0dc0\u0d9a\u0da7 \u0d8b\u0db4\u0dbb\u0dd2\u0db8 \u0d89\u0dbd\u0d9a\u0dca\u0d9a\u0db8\u0dca \u0d9c\u0dab\u0db1 </p>\n",34"<p>Move to device </p>\n": "<p>\u0d8b\u0db4\u0dcf\u0d82\u0d9c\u0dba\u0dc0\u0dd9\u0dad \u0d9c\u0dd9\u0db1 \u0dba\u0db1\u0dca\u0db1 </p>\n",35"<p>No need of a validation dataset </p>\n": "<p>\u0dc0\u0dbd\u0d82\u0d9c\u0dd4\u0daf\u0dad\u0dca\u0dad \u0d9a\u0da7\u0dca\u0da7\u0dbd\u0dba\u0d9a\u0dca \u0d85\u0dc0\u0dc1\u0dca\u0dba \u0db1\u0ddc\u0dc0\u0dda </p>\n",36"<p>Number of problems in evaluation </p>\n": "<p>\u0d87\u0d9c\u0dba\u0dd3\u0db8\u0dda\u0d9c\u0dd0\u0da7\u0dc5\u0dd4 \u0d9c\u0dab\u0db1 </p>\n",37"<p>Number of sequences that have completed </p>\n": "<p>\u0dc3\u0db8\u0dca\u0db4\u0dd6\u0dbb\u0dca\u0dab\u0d9a\u0dbb \u0d87\u0dad\u0dd2 \u0d85\u0db1\u0dd4\u0d9a\u0dca\u0dbb\u0db8 \u0d9c\u0dab\u0db1 </p>\n",38"<p>Number of times to run evaluations per epoch </p>\n": "<p>\u0d91\u0db4\u0ddd\u0da0\u0dca\u0d91\u0d9a\u0d9a\u0da7 \u0d87\u0d9c\u0dba\u0dd3\u0db8\u0dca \u0d9a\u0dca\u0dbb\u0dd2\u0dba\u0dcf\u0dad\u0dca\u0db8\u0d9a \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0da7 \u0dc0\u0dcf\u0dbb \u0d9c\u0dab\u0db1 </p>\n",39"<p>Number of tokens in the vocabulary </p>\n": "<p>\u0dc0\u0da0\u0db1\u0db8\u0dcf\u0dbd\u0dcf\u0dc0\u0dda \u0da7\u0ddd\u0d9a\u0db1 \u0d9c\u0dab\u0db1 </p>\n",40"<p>Number of training sequences per epoch </p>\n": "<p>\u0d91\u0db4\u0ddd\u0da0\u0dca\u0d91\u0d9a\u0d9a\u0da7 \u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4 \u0d85\u0db1\u0dd4\u0db4\u0dd2\u0dc5\u0dd2\u0dc0\u0dd9\u0dbd \u0d9c\u0dab\u0db1 </p>\n",41"<p>Override with the question </p>\n": "<p>\u0db4\u0dca\u0dbb\u0dc1\u0dca\u0db1\u0dba\u0dc3\u0db8\u0d9f \u0d85\u0db7\u0dd2\u0db6\u0dc0\u0dcf \u0dba\u0db1\u0dca\u0db1 </p>\n",42"<p>Sample upto sequence length </p>\n": "<p>\u0d85\u0db1\u0dd4\u0d9a\u0dca\u0dbb\u0db8\u0dd2\u0d9a\u0daf\u0dd2\u0d9c \u0daf\u0d9a\u0dca\u0dc0\u0dcf \u0db1\u0dd2\u0dba\u0dd0\u0daf\u0dd2\u0dba </p>\n",43"<p>Sampled results </p>\n": "<p>\u0db1\u0dd2\u0dba\u0dd0\u0daf\u0dd2\u0db4\u0dca\u0dbb\u0dad\u0dd2. \u0dbd </p>\n",44"<p>Skip if all have finished </p>\n": "<p>\u0dc3\u0dd2\u0dba\u0dbd\u0dca\u0dbd\u0d85\u0dc0\u0dc3\u0db1\u0dca \u0dc0\u0dd3 \u0d87\u0dad\u0dca\u0db1\u0db8\u0dca \u0db8\u0d9f \u0dc4\u0dbb\u0dd2\u0db1\u0dca\u0db1 </p>\n",45"<p>Skip in the first epoch </p>\n": "<p>\u0db4\u0dc5\u0db8\u0dd4\u0d91\u0db4\u0ddd\u0da0\u0dca \u0d91\u0d9a\u0dda \u0db8\u0d9f \u0dc4\u0dbb\u0dd2\u0db1\u0dca\u0db1 </p>\n",46"<p>Token id of the new line character - this marks end of the answer </p>\n": "<p>\u0db1\u0dc0\u0dbb\u0dda\u0d9b\u0dcf \u0d85\u0d9a\u0dca\u0dc2\u0dbb\u0dba\u0dd9\u0dc4\u0dd2 \u0da7\u0ddd\u0d9a\u0db1\u0dca \u0dc4\u0dd0\u0db3\u0dd4\u0db1\u0dd4\u0db8\u0dca\u0db4\u0dad - \u0db8\u0dd9\u0dba \u0db4\u0dd2\u0dc5\u0dd2\u0dad\u0dd4\u0dbb\u0dda \u0d85\u0dc0\u0dc3\u0dcf\u0db1\u0dba \u0dc3\u0dbd\u0d9a\u0dd4\u0dab\u0dd4 \u0d9a\u0dbb\u0dba\u0dd2 </p>\n",47"<p>Token id to string </p>\n": "<p>\u0db1\u0dd6\u0dbd\u0da7\u0da7\u0ddd\u0d9a\u0db1\u0dca \u0dc4\u0dd0\u0db3\u0dd4\u0db1\u0dd4\u0db8\u0dca\u0db4\u0dad </p>\n",48"<p>Training data loader </p>\n": "<p>\u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4\u0daf\u0dad\u0dca\u0dad \u0db4\u0dd0\u0da7\u0dc0\u0dd4\u0db8 </p>\n",49"<ul><li><span translate=no>_^_0_^_</span> is the sequence length of generated math problems. We fill as many problems as possible upto this length :max_digits: is the maximum number of digits in the operand integers :n_sequences: is the number of sequences per epoch</li></ul>\n": "<ul><li><span translate=no>_^_0_^_</span> \u0dba\u0db1\u0dd4 \u0da2\u0db1\u0db1\u0dba \u0d9a\u0dbb\u0db1 \u0dbd\u0daf \u0d9c\u0dab\u0dd2\u0dad \u0d9c\u0dd0\u0da7\u0dc5\u0dd4 \u0dc0\u0dbd \u0d85\u0db1\u0dd4\u0d9a\u0dca\u0dbb\u0db8\u0dd2\u0d9a \u0daf\u0dd2\u0d9c\u0dba\u0dd2. \u0db8\u0dd9\u0db8 \u0daf\u0dd2\u0d9c \u0daf\u0d9a\u0dca\u0dc0\u0dcf \u0d85\u0db4\u0dd2 \u0dc4\u0dd0\u0d9a\u0dd2 \u0dad\u0dbb\u0db8\u0dca \u0d9c\u0dd0\u0da7\u0dc5\u0dd4 \u0db4\u0dd4\u0dbb\u0dc0\u0db1\u0dca\u0db1\u0dd9\u0db8\u0dd4: max_digits: \u0dba\u0db1\u0dd4 \u0d94\u0db4\u0dd9\u0dbb\u0db1\u0dca\u0da9\u0dca \u0dc3\u0d82\u0d9b\u0dca\u200d\u0dba\u0dcf\u0dc0\u0dda \u0d8b\u0db4\u0dbb\u0dd2\u0db8 \u0d89\u0dbd\u0d9a\u0dca\u0d9a\u0db8\u0dca \u0dc3\u0d82\u0d9b\u0dca\u200d\u0dba\u0dcf\u0dc0 \u0dc0\u0dda: n_sequences: \u0dba\u0db1\u0dd4 \u0d91\u0db4\u0ddd\u0da0\u0dca \u0d91\u0d9a\u0d9a\u0da7 \u0d85\u0db1\u0dd4\u0d9a\u0dca\u200d\u0dbb\u0db8 \u0d9c\u0dab\u0db1</li></ul>\u0dc0\u0dda\n",50"Arithmetic Dataset": "\u0d85\u0d82\u0d9a \u0d9c\u0dab\u0dd2\u0dad \u0daf\u0dad\u0dca\u0dad \u0d9a\u0da7\u0dca\u0da7\u0dbd\u0dba",51"This creates arithmetic problems.": "\u0db8\u0dd9\u0dba \u0d85\u0d82\u0d9a \u0d9c\u0dab\u0dd2\u0dad \u0d9c\u0dd0\u0da7\u0dc5\u0dd4 \u0db1\u0dd2\u0dbb\u0dca\u0db8\u0dcf\u0dab\u0dba \u0d9a\u0dbb\u0dba\u0dd2."52}5354