Book a Demo!
CoCalc Logo Icon
StoreFeaturesDocsShareSupportNewsAboutPoliciesSign UpSign In
labmlai
GitHub Repository: labmlai/annotated_deep_learning_paper_implementations
Path: blob/master/translate_cache/experiments/nlp_classification.si.json
4923 views
1
{
2
"<h1>NLP model trainer for classification</h1>\n": "<h1>\u0dc0\u0dbb\u0dca\u0d9c\u0dd3\u0d9a\u0dbb\u0dab\u0dba\u0dc3\u0db3\u0dc4\u0dcf NLP \u0d86\u0d9a\u0dd8\u0dad\u0dd2 \u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4\u0d9a\u0dbb\u0dd4</h1>\n",
3
"<h2>Function to load data into batches</h2>\n": "<h2>\u0daf\u0dad\u0dca\u0dad\u0d9a\u0dcf\u0dab\u0dca\u0da9\u0dc0\u0dbd\u0da7 \u0db4\u0dd0\u0da7\u0dc0\u0dd3\u0db8\u0dda \u0d9a\u0dcf\u0dbb\u0dca\u0dba\u0dba</h2>\n",
4
"<h3>AG News dataset</h3>\n<p>This loads the AG News dataset and the set the values for <span translate=no>_^_0_^_</span>, <span translate=no>_^_1_^_</span>, <span translate=no>_^_2_^_</span>, and <span translate=no>_^_3_^_</span>.</p>\n": "<h3>AG\u0db4\u0dd4\u0dc0\u0dad\u0dca \u0daf\u0dad\u0dca\u0dad \u0d9a\u0da7\u0dca\u0da7\u0dbd\u0dba</h3>\n<p>\u0db8\u0dd9\u0dbaAG \u0db4\u0dd4\u0dc0\u0dad\u0dca \u0daf\u0dad\u0dca\u0dad \u0dc3\u0db8\u0dd4\u0daf\u0dcf\u0dba \u0db4\u0da7\u0dc0\u0db1 \u0d85\u0dad\u0dbb <span translate=no>_^_0_^_</span>, \u0dc3\u0db3\u0dc4\u0dcf \u0d85\u0d9c\u0dba\u0db1\u0dca \u0dc3\u0d9a\u0dc3\u0dcf \u0d87\u0dad, <span translate=no>_^_1_^_</span>, <span translate=no>_^_2_^_</span>, \u0dc3\u0dc4 <span translate=no>_^_3_^_</span>. </p>\n",
5
"<h3>Basic english tokenizer</h3>\n<p>We use character level tokenizer in this experiment. You can switch by setting,</p>\n<span translate=no>_^_0_^_</span><p>in the configurations dictionary when starting the experiment.</p>\n": "<h3>\u0db8\u0dd6\u0dbd\u0dd2\u0d9a\u0d89\u0d82\u0d9c\u0dca\u0dbb\u0dd3\u0dc3\u0dd2 \u0da7\u0ddd\u0d9a\u0db1\u0dba\u0dd2\u0dc3\u0dbb\u0dca</h3>\n<p>\u0db8\u0dd9\u0db8\u0d85\u0dad\u0dca\u0dc4\u0daf\u0dcf \u0db6\u0dd0\u0dbd\u0dd3\u0db8\u0dda\u0daf\u0dd3 \u0d85\u0db4\u0dd2 \u0da0\u0dbb\u0dd2\u0dad \u0db8\u0da7\u0dca\u0da7\u0db8\u0dda \u0da7\u0ddd\u0d9a\u0db1\u0dba\u0dd2\u0dc3\u0dbb\u0dca \u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0d9a\u0dbb\u0db8\u0dd4. \u0dc3\u0dd0\u0d9a\u0dc3\u0dd3\u0db8\u0dd9\u0db1\u0dca \u0d94\u0db6\u0da7 \u0db8\u0dcf\u0dbb\u0dd4 \u0dc0\u0dd2\u0dba \u0dc4\u0dd0\u0d9a\u0dd2\u0dba,</p>\n<span translate=no>_^_0_^_</span><p>\u0d85\u0dad\u0dca\u0dc4\u0daf\u0dcf\u0db6\u0dd0\u0dbd\u0dd3\u0db8 \u0d86\u0dbb\u0db8\u0dca\u0db7 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dda\u0daf\u0dd3 \u0dc0\u0dd2\u0db1\u0dca\u0dba\u0dcf\u0dc3 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dda \u0dc1\u0db6\u0dca\u0daf\u0d9a\u0ddd\u0dc2\u0dba\u0dda. </p>\n",
6
"<h3>Character level tokenizer</h3>\n": "<h3>\u0d85\u0d9a\u0dca\u0dc2\u0dbb\u0db8\u0da7\u0dca\u0da7\u0db8\u0dda \u0da7\u0ddd\u0d9a\u0db1\u0dba\u0dd2\u0dc3\u0dbb\u0dca</h3>\n",
7
"<h3>Default <a href=\"../optimizers/configs.html\">optimizer configurations</a></h3>\n": "<h3>\u0db4\u0dd9\u0dbb\u0db1\u0dd2\u0db8\u0dd2 <a href=\"../optimizers/configs.html\">\u0db4\u0dca\u0dbb\u0dc1\u0dc3\u0dca\u0dad\u0dd2\u0d9a\u0dbb\u0dab \u0dc0\u0dd2\u0db1\u0dca\u0dba\u0dcf\u0dc3\u0dba\u0db1\u0dca</a></h3>\n",
8
"<h3>Initialization</h3>\n": "<h3>\u0d86\u0dbb\u0db8\u0dca\u0db7\u0d9a\u0d9a\u0dbb\u0dab\u0dba</h3>\n",
9
"<h3>Training or validation step</h3>\n": "<h3>\u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4\u0dc0\u0dc4\u0ddd \u0dc0\u0dbd\u0d82\u0d9c\u0dd4 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dda \u0db4\u0dd2\u0dba\u0dc0\u0dbb</h3>\n",
10
"<p> </p>\n": "<p> </p>\n",
11
"<p> <a id=\"NLPClassificationConfigs\"></a></p>\n<h2>Trainer configurations</h2>\n<p>This has the basic configurations for NLP classification task training. All the properties are configurable.</p>\n": "<p> <a id=\"NLPClassificationConfigs\"></a></p>\n<h2>\u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4\u0d9a\u0dbb\u0dd4\u0db8\u0dcf\u0db1\u0d9a\u0dbb\u0dab</h2>\n<p>\u0d91\u0db1\u0dca\u0d91\u0dbd\u0dca\u0db4\u0dd3\u0dc0\u0dbb\u0dca\u0d9c\u0dd3\u0d9a\u0dbb\u0dab \u0d9a\u0dcf\u0dbb\u0dca\u0dba \u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4\u0dc0 \u0dc3\u0db3\u0dc4\u0dcf \u0db8\u0dd6\u0dbd\u0dd2\u0d9a \u0dc0\u0dd2\u0db1\u0dca\u0dba\u0dcf\u0dc3\u0dba\u0db1\u0dca \u0db8\u0dd9\u0dba\u0da7 \u0d87\u0dad. \u0dc3\u0dd2\u0dba\u0dbd\u0dd4\u0db8 \u0d9c\u0dd4\u0dab\u0dcf\u0d82\u0d9c \u0dc0\u0dd2\u0db1\u0dca\u0dba\u0dcf\u0dc3\u0d9c\u0dad \u0d9a\u0dc5 \u0dc4\u0dd0\u0d9a\u0dd2\u0dba. </p>\n",
12
"<p> Character level tokenizer configuration</p>\n": "<p> \u0d85\u0d9a\u0dca\u0dc2\u0dbb\u0db8\u0da7\u0dca\u0da7\u0db8\u0dda \u0da7\u0ddd\u0d9a\u0db1\u0dba\u0dd2\u0dc3\u0dbb\u0dca \u0dc0\u0dd2\u0db1\u0dca\u0dba\u0dcf\u0dc3\u0dba</p>\n",
13
"<p> Get number of tokens</p>\n": "<p> \u0da7\u0ddd\u0d9a\u0db1\u0d9c\u0dab\u0db1 \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1</p>\n",
14
"<p>Accuracy function </p>\n": "<p>\u0db1\u0dd2\u0dbb\u0dc0\u0daf\u0dca\u0dba\u0dad\u0dcf\u0dc1\u0dca\u0dbb\u0dd2\u0dad\u0dba </p>\n",
15
"<p>Add a hook to log module outputs </p>\n": "<p>\u0db8\u0ddc\u0da9\u0dd2\u0dba\u0dd4\u0dbd\u0db4\u0dca\u0dbb\u0dad\u0dd2\u0daf\u0dcf\u0db1\u0dba\u0db1\u0dca \u0dbd\u0ddc\u0d9c\u0dca \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0da7 \u0d9a\u0ddc\u0d9a\u0dca\u0d9a\u0d9a\u0dca \u0d91\u0d9a\u0dca \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
16
"<p>Add accuracy as a state module. The name is probably confusing, since it&#x27;s meant to store states between training and validation for RNNs. This will keep the accuracy metric stats separate for training and validation. </p>\n": "<p>\u0dbb\u0dcf\u0da2\u0dca\u0dba\u0db8\u0ddc\u0da9\u0dd2\u0dba\u0dd4\u0dbd\u0dba\u0d9a\u0dca \u0dbd\u0dd9\u0dc3 \u0db1\u0dd2\u0dbb\u0dc0\u0daf\u0dca\u0dba\u0dad\u0dcf\u0dc0 \u0d91\u0d9a\u0dca \u0d9a\u0dbb\u0db1\u0dca\u0db1. RNs \u0dc3\u0db3\u0dc4\u0dcf \u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4\u0dc0 \u0dc3\u0dc4 \u0dc0\u0dbd\u0d82\u0d9c\u0dd4 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0d85\u0dad\u0dbb \u0dbb\u0dcf\u0da2\u0dca\u0dba\u0dba\u0db1\u0dca \u0d9c\u0db6\u0da9\u0dcf \u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0d85\u0daf\u0dc4\u0dc3\u0dca \u0d9a\u0dbb\u0db1 \u0db6\u0dd0\u0dc0\u0dd2\u0db1\u0dca \u0db1\u0db8 \u0db6\u0ddc\u0dc4\u0ddd \u0dc0\u0dd2\u0da7 \u0dc0\u0dca\u0dba\u0dcf\u0d9a\u0dd6\u0dbd \u0dc0\u0dda. \u0db8\u0dd9\u0dba \u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4\u0dc0 \u0dc3\u0dc4 \u0dc0\u0dbd\u0d82\u0d9c\u0dd4 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0dc3\u0db3\u0dc4\u0dcf \u0db1\u0dd2\u0dbb\u0dc0\u0daf\u0dca\u0dba\u0dad\u0dcf \u0db8\u0dd9\u0da7\u0dca\u0dbb\u0dd2\u0d9a\u0dca \u0dc3\u0d82\u0d9b\u0dca\u0dba\u0dcf\u0db1 \u0dc0\u0dd9\u0db1\u0db8 \u0dad\u0db6\u0dcf \u0d9c\u0db1\u0dd3. </p>\n",
17
"<p>Autoregressive model </p>\n": "<p>\u0dc3\u0dca\u0dc0\u0dba\u0d82\u0d9a\u0dca\u0dbb\u0dd3\u0dba\u0db4\u0dca\u0dbb\u0dad\u0dd2\u0d9c\u0dcf\u0db8\u0dd3 \u0d86\u0d9a\u0dd8\u0dad\u0dd2\u0dba </p>\n",
18
"<p>Batch size </p>\n": "<p>\u0d9a\u0dab\u0dca\u0da9\u0dcf\u0dba\u0db8\u0dca\u0db4\u0dca\u0dbb\u0db8\u0dcf\u0dab\u0dba </p>\n",
19
"<p>Calculate and log accuracy </p>\n": "<p>\u0d9c\u0dab\u0db1\u0dba\u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0dc3\u0dc4 \u0dbd\u0ddc\u0d9c\u0dca \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dda \u0db1\u0dd2\u0dbb\u0dc0\u0daf\u0dca\u0dba\u0dad\u0dcf\u0dc0\u0dba </p>\n",
20
"<p>Calculate and log loss </p>\n": "<p>\u0d9c\u0dab\u0db1\u0dba\u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0dc3\u0dc4 \u0dbd\u0ddc\u0d9c\u0dca \u0dc0\u0dd3\u0db8 </p>\n",
21
"<p>Calculate gradients </p>\n": "<p>\u0d85\u0db1\u0dd4\u0d9a\u0dca\u0dbb\u0db8\u0dd2\u0d9a\u0d9c\u0dab\u0db1\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
22
"<p>Clear the gradients </p>\n": "<p>\u0d85\u0db1\u0dd4\u0d9a\u0dca\u0dbb\u0db8\u0dd2\u0d9a\u0d89\u0dc0\u0dad\u0dca </p>\n",
23
"<p>Clip gradients </p>\n": "<p>\u0d9a\u0dca\u0dbd\u0dd2\u0db4\u0dca\u0d85\u0db1\u0dd4\u0d9a\u0dca\u0dbb\u0db8\u0dd2\u0d9a </p>\n",
24
"<p>Collect tokens from training dataset </p>\n": "<p>\u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4\u0daf\u0dad\u0dca\u0dad \u0d9a\u0da7\u0dca\u0da7\u0dbd\u0dba\u0dd9\u0db1\u0dca \u0da7\u0ddd\u0d9a\u0db1 \u0d91\u0d9a\u0dad\u0dd4 \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
25
"<p>Collect tokens from validation dataset </p>\n": "<p>\u0dc0\u0dbd\u0d82\u0d9c\u0dd4\u0daf\u0dad\u0dca\u0dad \u0d9a\u0da7\u0dca\u0da7\u0dbd\u0dba\u0dd9\u0db1\u0dca \u0da7\u0ddd\u0d9a\u0db1 \u0d91\u0d9a\u0dad\u0dd4 \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
26
"<p>Create <a href=\"../utils.html#map_style_dataset\">map-style datasets</a> </p>\n": "<p><a href=\"../utils.html#map_style_dataset\">\u0dc3\u0dd2\u0dad\u0dd2\u0dba\u0db8\u0dca \u0d86\u0d9a\u0dcf\u0dbb\u0dba\u0dda \u0daf\u0dad\u0dca\u0dad \u0d9a\u0da7\u0dca\u0da7\u0dbd</a> \u0dc3\u0dcf\u0daf\u0db1\u0dca\u0db1 </p>\n",
27
"<p>Create a counter </p>\n": "<p>\u0d9a\u0dc0\u0dd4\u0db1\u0dca\u0da7\u0dbb\u0dba\u0d9a\u0dca\u0dc3\u0dcf\u0daf\u0db1\u0dca\u0db1 </p>\n",
28
"<p>Create training data loader </p>\n": "<p>\u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4\u0daf\u0dad\u0dca\u0dad \u0db4\u0dd0\u0da7\u0dc0\u0dd4\u0db8 \u0dc3\u0dcf\u0daf\u0db1\u0dca\u0db1 </p>\n",
29
"<p>Create validation data loader </p>\n": "<p>\u0dc0\u0dbd\u0d82\u0d9c\u0dd4\u0daf\u0dad\u0dca\u0dad \u0db4\u0dd0\u0da7\u0dc0\u0dd4\u0db8 \u0dc3\u0dcf\u0daf\u0db1\u0dca\u0db1 </p>\n",
30
"<p>Create vocabulary </p>\n": "<p>\u0dc0\u0da0\u0db1\u0db8\u0dcf\u0dbd\u0dcf\u0dc0 \u0dc3\u0dcf\u0daf\u0db1\u0dca\u0db1 </p>\n",
31
"<p>Empty labels tensor </p>\n": "<p>\u0dc4\u0dd2\u0dc3\u0dca\u0dbd\u0dda\u0db6\u0dbd\u0dca \u0da7\u0dd9\u0db1\u0dca\u0dc3\u0dbb\u0dca </p>\n",
32
"<p>Get model outputs. It&#x27;s returning a tuple for states when using RNNs. This is not implemented yet. \ud83d\ude1c </p>\n": "<p>\u0d86\u0daf\u0dbb\u0dca\u0dc1\u0db4\u0dca\u0dbb\u0dad\u0dd2\u0daf\u0dcf\u0db1\u0dba\u0db1\u0dca \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1. \u0d86\u0dbb\u0dca\u0d91\u0db1\u0dca\u0d91\u0dc3\u0dca \u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0d9a\u0dbb\u0db1 \u0dc0\u0dd2\u0da7 \u0d91\u0dba \u0db4\u0dca\u0dbb\u0dcf\u0db1\u0dca\u0dad \u0dc3\u0db3\u0dc4\u0dcf \u0da7\u0dd6\u0dbd\u0dca \u0d91\u0d9a\u0d9a\u0dca \u0db1\u0dd0\u0dc0\u0dad \u0dbd\u0db6\u0dcf \u0daf\u0dd9\u0dba\u0dd2. \u0db8\u0dd9\u0dba \u0dad\u0dc0\u0db8 \u0d9a\u0dca\u0dbb\u0dd2\u0dba\u0dcf\u0dad\u0dca\u0db8\u0d9a \u0d9a\u0dbb \u0db1\u0dd0\u0dad \ud83d\ude1c </p>\n",
33
"<p>Get tokenizer </p>\n": "<p>\u0da7\u0ddd\u0d9a\u0db1\u0dba\u0dd2\u0dc3\u0dbb\u0dca\u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1 </p>\n",
34
"<p>Get training and validation datasets </p>\n": "<p>\u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4\u0dc0\u0dc3\u0dc4 \u0dc0\u0dbd\u0d82\u0d9c\u0dd4 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dda \u0daf\u0dad\u0dca\u0dad \u0d9a\u0da7\u0dca\u0da7\u0dbd \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1 </p>\n",
35
"<p>Gradient clipping </p>\n": "<p>\u0dc1\u0dca\u0dbb\u0dda\u0dab\u0dd2\u0dba\u0dda\u0d9a\u0dca\u0dbd\u0dd2\u0db4\u0dd2\u0db1\u0dca </p>\n",
36
"<p>Input data tensor, initialized with <span translate=no>_^_0_^_</span> </p>\n": "<p>\u0d86\u0daf\u0dcf\u0db1\u0daf\u0dad\u0dca\u0dad \u0da7\u0dd9\u0db1\u0dca\u0dc3\u0dbb\u0dba, \u0dc3\u0db8\u0d9f \u0d86\u0dbb\u0db8\u0dca\u0db7 \u0d9a\u0dbb \u0d87\u0dad <span translate=no>_^_0_^_</span> </p>\n",
37
"<p>Length of the sequence, or context size </p>\n": "<p>\u0d85\u0db1\u0dd4\u0d9a\u0dca\u0dbb\u0db8\u0dba\u0dda\u0daf\u0dd2\u0d9c, \u0dc4\u0ddd \u0dc3\u0db1\u0dca\u0daf\u0dbb\u0dca\u0db7\u0dba \u0db4\u0dca\u0dbb\u0db8\u0dcf\u0dab\u0dba </p>\n",
38
"<p>Load data to memory </p>\n": "<p>\u0db8\u0dad\u0d9a\u0dba\u0dc0\u0dd9\u0dad \u0daf\u0dad\u0dca\u0dad \u0db4\u0dd6\u0dbb\u0dab\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
39
"<p>Log the model parameters and gradients on last batch of every epoch </p>\n": "<p>\u0dc3\u0dd1\u0db8\u0dba\u0dd4\u0d9c\u0dbd\u0dba\u0d9a\u0db8 \u0d85\u0dc0\u0dc3\u0dcf\u0db1 \u0d9a\u0dab\u0dca\u0da9\u0dcf\u0dba\u0db8\u0dda \u0d86\u0daf\u0dbb\u0dca\u0dc1 \u0db4\u0dbb\u0dcf\u0db8\u0dd2\u0dad\u0dd3\u0db1\u0dca \u0dc3\u0dc4 \u0d85\u0db1\u0dd4\u0d9a\u0dca\u0dbb\u0db8\u0dd2\u0d9a \u0dbd\u0ddc\u0d9c\u0dca \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
40
"<p>Loop through the samples </p>\n": "<p>\u0dc3\u0dcf\u0db8\u0dca\u0db4\u0dbd\u0dc4\u0dbb\u0dc4\u0dcf \u0dbd\u0dd6\u0db4 </p>\n",
41
"<p>Loss function </p>\n": "<p>\u0db4\u0dcf\u0da9\u0dd4\u0dc1\u0dca\u0dbb\u0dd2\u0dad\u0dba </p>\n",
42
"<p>Model embedding size </p>\n": "<p>\u0d86\u0daf\u0dbb\u0dca\u0dc1\u0d9a\u0dcf\u0dc0\u0dd0\u0daf\u0dca\u0daf\u0dd3\u0db8\u0dda \u0db4\u0dca\u0dbb\u0db8\u0dcf\u0dab\u0dba </p>\n",
43
"<p>Move data to the device </p>\n": "<p>\u0d8b\u0db4\u0dcf\u0d82\u0d9c\u0dba\u0dc0\u0dd9\u0dad \u0daf\u0dad\u0dca\u0dad \u0d9c\u0dd9\u0db1\u0dba\u0db1\u0dca\u0db1 </p>\n",
44
"<p>Number of classes </p>\n": "<p>\u0db4\u0db1\u0dca\u0dad\u0dd2\u0d9c\u0dab\u0db1 </p>\n",
45
"<p>Number of token in vocabulary </p>\n": "<p>\u0dc0\u0da0\u0db1\u0db8\u0dcf\u0dbd\u0dcf\u0dc0\u0dda \u0da7\u0ddd\u0d9a\u0db1\u0dca \u0d9c\u0dab\u0db1 </p>\n",
46
"<p>Optimizer </p>\n": "<p>\u0db4\u0dca\u0dbb\u0dc1\u0dc3\u0dca\u0dad\u0d9a\u0dbb\u0dab\u0dba </p>\n",
47
"<p>Return <span translate=no>_^_0_^_</span>, <span translate=no>_^_1_^_</span>, <span translate=no>_^_2_^_</span>, and <span translate=no>_^_3_^_</span> </p>\n": "<p>\u0d86\u0db4\u0dc3\u0dd4 <span translate=no>_^_0_^_</span><span translate=no>_^_1_^_</span>, <span translate=no>_^_2_^_</span>, \u0dc3\u0dc4 <span translate=no>_^_3_^_</span> </p>\n",
48
"<p>Save the tracked metrics </p>\n": "<p>\u0dbd\u0dd4\u0dc4\u0dd4\u0db6\u0dd0\u0db3\u0d87\u0dad\u0dd2 \u0db4\u0dca\u0dbb\u0db8\u0dd2\u0dad\u0dd2\u0d9a \u0dc3\u0dd4\u0dbb\u0d9a\u0dd2\u0db1\u0dca\u0db1 </p>\n",
49
"<p>Set the final token in the sequence to <span translate=no>_^_0_^_</span> </p>\n": "<p>\u0d85\u0db1\u0dd4\u0db4\u0dd2\u0dc5\u0dd2\u0dc0\u0dd9\u0dbd\u0dd9\u0dc4\u0dd2\u0d85\u0dc0\u0dc3\u0dcf\u0db1 \u0da7\u0ddd\u0d9a\u0db1\u0dba \u0dc3\u0d9a\u0dc3\u0db1\u0dca\u0db1 <span translate=no>_^_0_^_</span> </p>\n",
50
"<p>Set the label </p>\n": "<p>\u0dbd\u0dda\u0db6\u0dbd\u0dba\u0dc3\u0d9a\u0dc3\u0db1\u0dca\u0db1 </p>\n",
51
"<p>Set tracker configurations </p>\n": "<p>\u0da7\u0dca\u0dbb\u0dd0\u0d9a\u0dbb\u0dca\u0dc0\u0dd2\u0db1\u0dca\u0dba\u0dcf\u0dc3\u0dba\u0db1\u0dca \u0dc3\u0d9a\u0dc3\u0db1\u0dca\u0db1 </p>\n",
52
"<p>Take optimizer step </p>\n": "<p>\u0db4\u0dca\u0dbb\u0dc1\u0dc3\u0dca\u0dad\u0dd2\u0d9a\u0dbb\u0dab\u0db4\u0dd2\u0dba\u0dc0\u0dbb \u0d9c\u0db1\u0dca\u0db1 </p>\n",
53
"<p>Tokenize the input text </p>\n": "<p>\u0d86\u0daf\u0dcf\u0db1\u0db4\u0dd9\u0dc5 \u0da7\u0ddd\u0d9a\u0db1\u0dba\u0dd2\u0dc3\u0dca \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
54
"<p>Tokenizer </p>\n": "<p>\u0da7\u0ddd\u0d9a\u0db1\u0dba\u0dd2\u0dc3\u0dbb\u0dca </p>\n",
55
"<p>Train the model </p>\n": "<p>\u0d86\u0d9a\u0dd8\u0dad\u0dd2\u0dba\u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4 \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
56
"<p>Training data loader </p>\n": "<p>\u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4\u0daf\u0dad\u0dca\u0dad \u0db4\u0dd0\u0da7\u0dc0\u0dd4\u0db8 </p>\n",
57
"<p>Training device </p>\n": "<p>\u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4\u0d8b\u0db4\u0dcf\u0d82\u0d9c\u0dba </p>\n",
58
"<p>Transpose and add to data </p>\n": "<p>\u0daf\u0dad\u0dca\u0dad\u0dc3\u0db8\u0dca\u0db4\u0dca\u0dbb\u0dda\u0dc2\u0dab\u0dba \u0d9a\u0dbb \u0d91\u0d9a\u0dad\u0dd4 \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
59
"<p>Truncate upto <span translate=no>_^_0_^_</span> </p>\n": "<p>\u0daf\u0d9a\u0dca\u0dc0\u0dcf\u0da7\u0db1\u0dca\u0d9a \u0d9a\u0dbb\u0db1\u0dca\u0db1 <span translate=no>_^_0_^_</span> </p>\n",
60
"<p>Update global step (number of tokens processed) when in training mode </p>\n": "<p>\u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4\u0db4\u0dca\u0dbb\u0d9a\u0dcf\u0dbb\u0dba\u0dda\u0daf\u0dd3 \u0d9c\u0ddd\u0dbd\u0dd3\u0dba \u0db4\u0dd2\u0dba\u0dc0\u0dbb \u0dba\u0dcf\u0dc0\u0dad\u0dca\u0d9a\u0dcf\u0dbd\u0dd3\u0db1 \u0d9a\u0dbb\u0db1\u0dca\u0db1 (\u0dc3\u0dd0\u0d9a\u0dc3\u0dd6 \u0da7\u0ddd\u0d9a\u0db1 \u0d9c\u0dab\u0db1) </p>\n",
61
"<p>Validation data loader </p>\n": "<p>\u0dc0\u0dbd\u0d82\u0d9c\u0dd4\u0daf\u0dad\u0dca\u0dad \u0db4\u0dd0\u0da7\u0dc0\u0dd4\u0db8 </p>\n",
62
"<p>Vocabulary </p>\n": "<p>\u0dc0\u0da0\u0db1\u0db8\u0dcf\u0dbd\u0dcf\u0dc0 </p>\n",
63
"<p>Whether to capture model outputs </p>\n": "<p>\u0d86\u0d9a\u0dd8\u0dad\u0dd2\u0db4\u0dca\u0dbb\u0dad\u0dd2\u0daf\u0dcf\u0db1\u0dba\u0db1\u0dca \u0d9c\u0dca\u0dbb\u0dc4\u0dab\u0dba \u0d9a\u0dbb \u0d9c\u0dad \u0dba\u0dd4\u0dad\u0dd4\u0daf \u0dba\u0db1\u0dca\u0db1 </p>\n",
64
"<p>Whether to log model activations (once per epoch). These are summarized stats per layer, but it could still lead to many indicators for very deep networks. </p>\n": "<p>\u0d86\u0daf\u0dbb\u0dca\u0dc1\u0dc3\u0d9a\u0dca\u0dbb\u0dd2\u0dba \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dca \u0dbd\u0ddc\u0d9c\u0dca \u0d9a\u0dc5 \u0dba\u0dd4\u0dad\u0dd4\u0daf \u0dba\u0db1\u0dca\u0db1 (\u0d91\u0d9a\u0dca \u0d91\u0d9a\u0dca \u0d8a\u0db4\u0ddd\u0da0\u0dca \u0d91\u0d9a\u0d9a\u0da7 \u0dc0\u0dbb\u0d9a\u0dca). \u0db8\u0dda\u0dc0\u0dcf \u0dc3\u0dca\u0dae\u0dbb\u0dba\u0d9a\u0da7 \u0dc3\u0dcf\u0dbb\u0dcf\u0d82\u0dc1\u0d9c\u0dad \u0dc3\u0d82\u0d9b\u0dca\u0dba\u0dcf\u0db1 \u0dc0\u0dda, \u0db1\u0db8\u0dd4\u0dad\u0dca \u0d91\u0dba \u0dad\u0dc0\u0db8\u0dad\u0dca \u0d89\u0dad\u0dcf \u0d9c\u0dd0\u0db9\u0dd4\u0dbb\u0dd4 \u0da2\u0dcf\u0dbd \u0dc3\u0db3\u0dc4\u0dcf \u0db6\u0ddc\u0dc4\u0ddd \u0daf\u0dbb\u0dca\u0dc1\u0d9a \u0dc0\u0dbd\u0da7 \u0dc4\u0dda\u0dad\u0dd4 \u0dc0\u0dd2\u0dba \u0dc4\u0dd0\u0d9a\u0dd2\u0dba. </p>\n",
65
"<p>Whether to log model parameters and gradients (once per epoch). These are summarized stats per layer, but it could still lead to many indicators for very deep networks. </p>\n": "<p>\u0d86\u0daf\u0dbb\u0dca\u0dc1\u0db4\u0dbb\u0dcf\u0db8\u0dd2\u0dad\u0dd3\u0db1\u0dca \u0dc3\u0dc4 \u0d85\u0db1\u0dd4\u0d9a\u0dca\u0dbb\u0db8\u0dd2\u0d9a \u0dbd\u0d9d\u0dd4-\u0dc3\u0da7\u0dc4\u0db1 \u0dba\u0db1\u0dca\u0db1 (\u0d91\u0d9a\u0dca \u0d91\u0d9a\u0dca \u0d91\u0d9a\u0dca \u0d91\u0d9a\u0dca \u0d91\u0d9a\u0dca \u0dc0\u0dbb\u0d9a\u0dca). \u0db8\u0dda\u0dc0\u0dcf \u0dc3\u0dca\u0dae\u0dbb\u0dba\u0d9a\u0da7 \u0dc3\u0dcf\u0dbb\u0dcf\u0d82\u0dc1\u0d9c\u0dad \u0dc3\u0d82\u0d9b\u0dca\u0dba\u0dcf\u0db1 \u0dc0\u0dda, \u0db1\u0db8\u0dd4\u0dad\u0dca \u0d91\u0dba \u0dad\u0dc0\u0db8\u0dad\u0dca \u0d89\u0dad\u0dcf \u0d9c\u0dd0\u0db9\u0dd4\u0dbb\u0dd4 \u0da2\u0dcf\u0dbd \u0dc3\u0db3\u0dc4\u0dcf \u0db6\u0ddc\u0dc4\u0ddd \u0daf\u0dbb\u0dca\u0dc1\u0d9a \u0dc0\u0dbd\u0da7 \u0dc4\u0dda\u0dad\u0dd4 \u0dc0\u0dd2\u0dba \u0dc4\u0dd0\u0d9a\u0dd2\u0dba. </p>\n",
66
"<p>Whether to periodically save models </p>\n": "<p>\u0dc0\u0dbb\u0dd2\u0db1\u0dca\u0dc0\u0dbb \u0d86\u0d9a\u0dd8\u0dad\u0dd2 \u0dc3\u0dd4\u0dbb\u0dd0\u0d9a\u0dd3\u0db8\u0da7 \u0dba\u0db1\u0dca\u0db1 </p>\n",
67
"<ul><li><span translate=no>_^_0_^_</span> is the batch of data collected by the <span translate=no>_^_1_^_</span></li></ul>\n": "<ul><li><span translate=no>_^_0_^_</span> \u0dc0\u0dd2\u0dc3\u0dd2\u0db1\u0dca \u0d91\u0d9a\u0dad\u0dd4 \u0d9a\u0dbb\u0db1 \u0dbd\u0daf \u0daf\u0dad\u0dca\u0dad \u0d9a\u0dcf\u0dab\u0dca\u0da9\u0dba\u0dba\u0dd2 <span translate=no>_^_1_^_</span></li></ul>\n",
68
"<ul><li><span translate=no>_^_0_^_</span> is the tokenizer function </li>\n<li><span translate=no>_^_1_^_</span> is the vocabulary </li>\n<li><span translate=no>_^_2_^_</span> is the length of the sequence </li>\n<li><span translate=no>_^_3_^_</span> is the token used for padding when the <span translate=no>_^_4_^_</span> is larger than the text length </li>\n<li><span translate=no>_^_5_^_</span> is the <span translate=no>_^_6_^_</span> token which we set at end of the input</li></ul>\n": "<ul><li><span translate=no>_^_0_^_</span> \u0da7\u0ddd\u0d9a\u0db1\u0dba\u0dd2\u0dc3\u0dbb\u0dca \u0dc1\u0dca\u0dbb\u0dd2\u0dad\u0dba \u0dc0\u0dda </li>\n<li><span translate=no>_^_1_^_</span> \u0dba\u0db1\u0dd4 \u0dc0\u0da0\u0db1 \u0db8\u0dcf\u0dbd\u0dcf\u0dc0\u0dba\u0dd2 </li>\n<li><span translate=no>_^_2_^_</span> \u0d85\u0db1\u0dd4\u0d9a\u0dca\u0dbb\u0db8\u0dba\u0dda \u0daf\u0dd2\u0d9c \u0dc0\u0dda </li>\n<li><span translate=no>_^_3_^_</span> \u0dba\u0db1\u0dd4 \u0db4\u0dd9\u0dc5 \u0daf\u0dd2\u0d9c\u0da7 \u0dc0\u0da9\u0dcf \u0dc0\u0dd2\u0dc1\u0dcf\u0dbd <span translate=no>_^_4_^_</span> \u0dc0\u0db1 \u0dc0\u0dd2\u0da7 \u0db4\u0dd1\u0da9\u0dd2\u0db1\u0dca \u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0dc3\u0db3\u0dc4\u0dcf \u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0d9a\u0dbb\u0db1 \u0da7\u0ddd\u0d9a\u0db1\u0dba \u0dc0\u0dda </li>\n<li><span translate=no>_^_5_^_</span> \u0dba\u0db1\u0dd4 \u0d86\u0daf\u0dcf\u0db1\u0dba \u0d85\u0dc0\u0dc3\u0dcf\u0db1\u0dba\u0dda \u0d85\u0db4 \u0dc0\u0dd2\u0dc3\u0dd2\u0db1\u0dca \u0dc3\u0d9a\u0dc3\u0dca \u0d9a\u0dbb\u0db1 \u0dbd\u0daf <span translate=no>_^_6_^_</span> \u0da7\u0ddd\u0d9a\u0db1\u0dba\u0dba\u0dd2</li></ul>\n",
69
"NLP classification trainer": "NLP \u0dc0\u0dbb\u0dca\u0d9c\u0dd3\u0d9a\u0dbb\u0dab \u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4\u0d9a\u0dbb\u0dd4",
70
"This is a reusable trainer for classification tasks": "\u0db8\u0dd9\u0dba \u0dc0\u0dbb\u0dca\u0d9c\u0dd3\u0d9a\u0dbb\u0dab \u0d9a\u0dcf\u0dbb\u0dca\u0dba\u0dba\u0db1\u0dca \u0dc3\u0db3\u0dc4\u0dcf \u0db1\u0dd0\u0dc0\u0dad \u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0d9a\u0dc5 \u0dc4\u0dd0\u0d9a\u0dd2 \u0db4\u0dd4\u0dc4\u0dd4\u0dab\u0dd4\u0d9a\u0dbb\u0dd4\u0dc0\u0d9a\u0dd2"
71
}
72