CoCalc -- unet.si.json

GitHub Repository: labmlai/annotated_deep_learning_paper_implementations
Path: blob/master/translate_cache/diffusion/ddpm/unet.si.json
⁴⁹³¹ views
1
{
2
 "<h1>U-Net model for <a href=\"index.html\">Denoising Diffusion Probabilistic Models (DDPM)</a></h1>\n<p>This is a <a href=\"../../unet/index.html\">U-Net</a> based model to predict noise <span translate=no>_^_0_^_</span>.</p>\n<p>U-Net is a gets it&#x27;s name from the U shape in the model diagram. It processes a given image by progressively lowering (halving) the feature map resolution and then increasing the resolution. There are pass-through connection at each resolution.</p>\n<p><span translate=no>_^_1_^_</span></p>\n<p>This implementation contains a bunch of modifications to original U-Net (residual blocks, multi-head attention)  and also adds time-step embeddings <span translate=no>_^_2_^_</span>.</p>\n": "<h1><a href=\"index.html\">\u0dc0\u0dd2\u0dc3\u0dbb\u0dab \u0dc3\u0db8\u0dca\u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0d86\u0d9a\u0dd8\u0dad\u0dd2 \u0db1\u0dd2\u0dbb\u0dd6\u0db4\u0dab\u0dba \u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0dc3\u0db3\u0dc4\u0dcf \u0dba\u0dd6-\u0db1\u0dd9\u0da7\u0dca \u0d86\u0d9a\u0dd8\u0dad\u0dd2\u0dba (\u0da9\u0dd3\u0da9\u0dd3\u0db4\u0dd3\u0d91\u0db8\u0dca)</a></h1>\n<p>\u0dc1\u0db6\u0dca\u0daf\u0dba\u0db4\u0dd4\u0dbb\u0ddd\u0d9a\u0dae\u0db1\u0dba \u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0dc3\u0db3\u0dc4\u0dcf \u0db8\u0dd9\u0dba <a href=\"../../unet/index.html\">\u0dba\u0dd6-\u0db1\u0dd9\u0da7\u0dca</a> \u0db4\u0daf\u0db1\u0db8\u0dca \u0d9a\u0dbb\u0d9c\u0dad\u0dca \u0d86\u0d9a\u0dd8\u0dad\u0dd2\u0dba\u0d9a\u0dd2 <span translate=no>_^_0_^_</span>. </p>\n<p>\u0dba\u0dd6-\u0db1\u0dd9\u0da7\u0dca\u0dba\u0db1\u0dd4 \u0d86\u0daf\u0dbb\u0dca\u0dc1 \u0dbb\u0dd6\u0db4 \u0dc3\u0da7\u0dc4\u0db1\u0dda \u0dba\u0dd6 \u0dc4\u0dd0\u0da9\u0dba\u0dd9\u0db1\u0dca \u0d91\u0dba \u0db1\u0db8 \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dd3. \u0dc0\u0dd2\u0dc1\u0dda\u0dc2\u0dcf\u0d82\u0d9c \u0dc3\u0dd2\u0dad\u0dd2\u0dba\u0db8\u0dca \u0dc0\u0dd2\u0db7\u0dda\u0daf\u0db1\u0dba \u0d9a\u0dca\u0dbb\u0db8\u0dba\u0dd9\u0db1\u0dca \u0d85\u0da9\u0dd4 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dd9\u0db1\u0dca (\u0d85\u0da9\u0d9a\u0dca) \u0dc3\u0dc4 \u0dc0\u0dd2\u0db7\u0dda\u0daf\u0db1\u0dba \u0dc0\u0dd0\u0da9\u0dd2 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dd9\u0db1\u0dca \u0d91\u0dba \u0dbd\u0db6\u0dcf \u0daf\u0dd3 \u0d87\u0dad\u0dd2 \u0dbb\u0dd6\u0db4\u0dba\u0d9a\u0dca \u0dc3\u0d9a\u0dc3\u0db1\u0dd4 \u0dbd\u0dd0\u0db6\u0dda. \u0dc3\u0dd1\u0db8 \u0dc0\u0dd2\u0db7\u0dda\u0daf\u0db1\u0dba\u0d9a\u0daf\u0dd3\u0db8 \u0db4\u0dcf\u0dc3\u0dca-\u0dc4\u0dbb\u0dc4\u0dcf \u0dc3\u0db8\u0dca\u0db6\u0db1\u0dca\u0db0\u0dad\u0dcf\u0dc0\u0dba\u0d9a\u0dca \u0d87\u0dad. </p>\n<p><span translate=no>_^_1_^_</span></p>\n<p>\u0db8\u0dd9\u0db8\u0d9a\u0dca\u0dbb\u0dd2\u0dba\u0dcf\u0dad\u0dca\u0db8\u0d9a \u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0db8\u0dd4\u0dbd\u0dca \u0dba\u0dd6-\u0db1\u0dd9\u0da7\u0dca (\u0d85\u0dc0\u0dc1\u0dda\u0dc2 \u0d9a\u0dd4\u0da7\u0dca\u0da7\u0dd2, \u0db6\u0dc4\u0dd4-\u0dc4\u0dd2\u0dc3 \u0d85\u0dc0\u0db0\u0dcf\u0db1\u0dba) \u0dc3\u0db3\u0dc4\u0dcf \u0dc0\u0dd9\u0db1\u0dc3\u0dca \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dca \u0dbb\u0dcf\u0dc1\u0dd2\u0dba\u0d9a\u0dca \u0d85\u0da9\u0d82\u0d9c\u0dd4 \u0dc0\u0db1 \u0d85\u0dad\u0dbb \u0d9a\u0dcf\u0dbd-\u0db4\u0dd2\u0dba\u0dc0\u0dbb \u0d9a\u0dcf\u0dc0\u0dd0\u0daf\u0dca\u0daf\u0dd3\u0db8\u0dca \u0d91\u0d9a\u0dad\u0dd4 \u0d9a\u0dbb\u0dba\u0dd2 <span translate=no>_^_2_^_</span>. </p>\n",
3
 "<h2>U-Net</h2>\n": "<h2>\u0dba\u0dd6-\u0db1\u0dd9\u0da7\u0dca</h2>\n",
4
 "<h3>Attention block</h3>\n<p>This is similar to <a href=\"../../transformers/mha.html\">transformer multi-head attention</a>.</p>\n": "<h3>\u0d85\u0dc0\u0db0\u0dcf\u0db1\u0dba\u0dc0\u0dcf\u0dbb\u0dab</h3>\n<p>\u0db8\u0dd9\u0dba <a href=\"../../transformers/mha.html\">\u0da7\u0dca\u0dbb\u0dcf\u0db1\u0dca\u0dc3\u0dca\u0dc6\u0ddd\u0db8\u0dbb\u0dca \u0db6\u0dc4\u0dd4-\u0dc4\u0dd2\u0dc3 \u0d85\u0dc0\u0db0\u0dcf\u0db1\u0dba\u0da7</a>\u0dc3\u0db8\u0dcf\u0db1 \u0dc0\u0dda. </p>\n",
5
 "<h3>Down block</h3>\n<p>This combines <span translate=no>_^_0_^_</span> and <span translate=no>_^_1_^_</span>. These are used in the first half of U-Net at each resolution.</p>\n": "<h3>\u0db6\u0dca\u0dbd\u0ddc\u0d9a\u0dca\u0da9\u0dc0\u0dd4\u0db1\u0dca</h3>\n<p>\u0db8\u0dd9\u0dba\u0d92\u0d9a\u0dcf\u0db6\u0daf\u0dca\u0db0 <span translate=no>_^_0_^_</span> \u0dc4\u0dcf <span translate=no>_^_1_^_</span>. \u0db8\u0dd9\u0db8 \u0d91\u0d9a\u0dca \u0d91\u0d9a\u0dca \u0dba\u0ddd\u0da2\u0db1\u0dcf\u0dc0 \u0daf\u0dd3 U-Net \u0db4\u0dc5\u0db8\u0dd4 \u0db7\u0dcf\u0d9c\u0dba\u0dda \u0daf\u0dd3 \u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0dc0\u0dda. </p>\n",
6
 "<h3>Embeddings for <span translate=no>_^_0_^_</span></h3>\n": "<h3>\u0d9a\u0dcf\u0dc0\u0dd0\u0daf\u0dca\u0daf\u0dd3\u0db8\u0dca\u0dc3\u0db3\u0dc4\u0dcf <span translate=no>_^_0_^_</span></h3>\n",
7
 "<h3>Middle block</h3>\n<p>It combines a <span translate=no>_^_0_^_</span>, <span translate=no>_^_1_^_</span>, followed by another <span translate=no>_^_2_^_</span>. This block is applied at the lowest resolution of the U-Net.</p>\n": "<h3>\u0db8\u0dd0\u0daf\u0d9a\u0ddc\u0da7\u0dc3</h3>\n<p>\u0d91\u0dba\u0dad\u0dc0\u0dad\u0dca \u0d91\u0d9a\u0d9a\u0dca <span translate=no>_^_0_^_</span>\u0dc3\u0db8\u0d9f \u0d92\u0d9a\u0dcf\u0db6\u0daf\u0dca\u0db0 <span translate=no>_^_2_^_</span>\u0dc0\u0dda. <span translate=no>_^_1_^_</span> \u0db8\u0dd9\u0db8 \u0d9a\u0ddc\u0da7\u0dc3 U-Net \u0dc4\u0dd2 \u0d85\u0da9\u0dd4\u0db8 \u0dc0\u0dd2\u0db7\u0dda\u0daf\u0db1\u0dba\u0dd9\u0db1\u0dca \u0dba\u0ddc\u0daf\u0db1\u0dd4 \u0dbd\u0dd0\u0db6\u0dda. </p>\n",
8
 "<h3>Residual block</h3>\n<p>A residual block has two convolution layers with group normalization. Each resolution is processed with two residual blocks.</p>\n": "<h3>\u0d85\u0dc0\u0dc1\u0dda\u0dc2\u0d9a\u0ddc\u0da7\u0dc3</h3>\n<p>\u0d85\u0dc0\u0dc1\u0dda\u0dc2\u0d9a\u0ddc\u0da7\u0dc3\u0d9a\u0daf\u0dd3 \u0d9a\u0dab\u0dca\u0da9\u0dcf\u0dba\u0db8\u0dca \u0dc3\u0dcf\u0db8\u0dcf\u0db1\u0dca\u0dba\u0d9a\u0dbb\u0dab\u0dba \u0dc3\u0db8\u0d9c convolution \u0dc3\u0dca\u0dae\u0dbb \u0daf\u0dd9\u0d9a\u0d9a\u0dca \u0d87\u0dad. \u0dc3\u0dd1\u0db8 \u0dc0\u0dd2\u0db7\u0dda\u0daf\u0db1\u0dba\u0d9a\u0dca\u0db8 \u0d85\u0dc0\u0dc1\u0dda\u0dc2 \u0d9a\u0ddc\u0da7\u0dc3\u0dca \u0daf\u0dd9\u0d9a\u0d9a\u0dd2\u0db1\u0dca \u0dc3\u0d9a\u0dc3\u0db1\u0dd4 \u0dbd\u0dd0\u0db6\u0dda. </p>\n",
9
 "<h3>Scale down the feature map by <span translate=no>_^_0_^_</span></h3>\n": "<h3>\u0dc0\u0dd2\u0dc1\u0dda\u0dc2\u0dcf\u0d82\u0d9c\u0dc3\u0dd2\u0dad\u0dd2\u0dba\u0db8 \u0db4\u0dbb\u0dd2\u0db8\u0dcf\u0dab\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1 <span translate=no>_^_0_^_</span></h3>\n",
10
 "<h3>Scale up the feature map by <span translate=no>_^_0_^_</span></h3>\n": "<h3>\u0dc0\u0dd2\u0dc1\u0dda\u0dc2\u0dcf\u0d82\u0d9c\u0dc3\u0dd2\u0dad\u0dd2\u0dba\u0db8 \u0db4\u0dbb\u0dd2\u0db8\u0dcf\u0dab\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1 <span translate=no>_^_0_^_</span></h3>\n",
11
 "<h3>Swish actiavation function</h3>\n<p><span translate=no>_^_0_^_</span></p>\n": "<h3>\u0dc3\u0dca\u0dc0\u0dd2\u0dc3\u0dca\u0dc2\u0dca\u0d9a\u0dca\u0dbb\u0dd2\u0dba\u0dcf\u0d9a\u0dcf\u0dbb\u0dd3 \u0dc1\u0dca\u0dbb\u0dd2\u0dad\u0dba</h3>\n<p><span translate=no>_^_0_^_</span></p>\n",
12
 "<h3>Up block</h3>\n<p>This combines <span translate=no>_^_0_^_</span> and <span translate=no>_^_1_^_</span>. These are used in the second half of U-Net at each resolution.</p>\n": "<h3>\u0db6\u0dca\u0dbd\u0ddc\u0d9a\u0dca\u0daf\u0d9a\u0dca\u0dc0\u0dcf</h3>\n<p>\u0db8\u0dd9\u0dba\u0d92\u0d9a\u0dcf\u0db6\u0daf\u0dca\u0db0 <span translate=no>_^_0_^_</span> \u0dc4\u0dcf <span translate=no>_^_1_^_</span>. \u0dc3\u0dd1\u0db8 \u0dc0\u0dd2\u0db7\u0dda\u0daf\u0db1\u0dba\u0d9a\u0daf\u0dd3\u0db8 \u0dba\u0dd6-\u0db1\u0dd9\u0da7\u0dca \u0dc4\u0dd2 \u0daf\u0dd9\u0dc0\u0db1 \u0db7\u0dcf\u0d9c\u0dba\u0dda\u0daf\u0dd3 \u0db8\u0dda\u0dc0\u0dcf \u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0dc0\u0dda. </p>\n",
13
 "<h4>First half of U-Net - decreasing resolution</h4>\n": "<h4>U-Net\u0db4\u0dc5\u0db8\u0dd4 \u0db7\u0dcf\u0d9c\u0dba - \u0d85\u0da9\u0dd4 \u0dba\u0ddd\u0da2\u0db1\u0dcf\u0dc0</h4>\n",
14
 "<h4>Second half of U-Net - increasing resolution</h4>\n": "<h4>\u0dba\u0dd6-\u0db1\u0dd9\u0da7\u0dca\u0dc4\u0dd2 \u0daf\u0dd9\u0dc0\u0db1 \u0db7\u0dcf\u0d9c\u0dba - \u0dc0\u0dd0\u0da9\u0dd2 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dda \u0dc0\u0dd2\u0db7\u0dda\u0daf\u0db1\u0dba</h4>\n",
15
 "<p> </p>\n": "<p> </p>\n",
16
 "<p><span translate=no>_^_0_^_</span> at the same resolution </p>\n": "<p><span translate=no>_^_0_^_</span> \u0d91\u0d9a\u0db8 \u0dc0\u0dd2\u0db7\u0dda\u0daf\u0db1\u0dba\u0dda </p>\n",
17
 "<p><span translate=no>_^_0_^_</span> is not used, but it&#x27;s kept in the arguments because for the attention layer function signature to match with <span translate=no>_^_1_^_</span>. </p>\n": "<p><span translate=no>_^_0_^_</span> \u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0db1\u0ddc\u0d9a\u0dd9\u0dbb\u0dda, \u0db1\u0db8\u0dd4\u0dad\u0dca \u0d91\u0dba \u0dad\u0dbb\u0dca\u0d9a\u0dc0\u0dbd \u0dad\u0db6\u0dcf \u0d87\u0dad\u0dca\u0dad\u0dda \u0d85\u0dc0\u0db0\u0dcf\u0db1\u0dba \u0dba\u0ddc\u0db8\u0dd4 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8\u0dda \u0dc3\u0dca\u0dae\u0dbb \u0dc1\u0dca\u0dbb\u0dd2\u0dad\u0dba\u0dda \u0d85\u0dad\u0dca\u0dc3\u0db1 \u0dc3\u0db8\u0d9f \u0d9c\u0dd0\u0dbd\u0db4\u0dd9\u0db1 \u0db6\u0dd0\u0dc0\u0dd2\u0db1\u0dd2 <span translate=no>_^_1_^_</span>. </p>\n",
18
 "<p><span translate=no>_^_0_^_</span> will store outputs at each resolution for skip connection </p>\n": "<p><span translate=no>_^_0_^_</span> \u0db8\u0d9f \u0dc4\u0dd0\u0dbb\u0dd3\u0db8\u0dda \u0dc3\u0db8\u0dca\u0db6\u0db1\u0dca\u0db0\u0dad\u0dcf\u0dc0\u0dba \u0dc3\u0db3\u0dc4\u0dcf \u0d91\u0d9a\u0dca \u0d91\u0d9a\u0dca \u0dc0\u0dd2\u0db7\u0dda\u0daf\u0db1\u0dba\u0dda \u0db4\u0dca\u0dbb\u0dad\u0dd2\u0daf\u0dcf\u0db1\u0dba\u0db1\u0dca \u0d9c\u0db6\u0da9\u0dcf \u0d9a\u0dbb\u0db1\u0dd4 \u0d87\u0dad </p>\n",
19
 "<p>Activation </p>\n": "<p>\u0dc3\u0d9a\u0dca\u200d\u0dbb\u0dd3\u0dba\u0d9a\u0dd2\u0dbb\u0dd3\u0db8 </p>\n",
20
 "<p>Add <span translate=no>_^_0_^_</span> </p>\n": "<p>\u0d91\u0d9a\u0dad\u0dd4\u0d9a\u0dbb\u0db1\u0dca\u0db1 <span translate=no>_^_0_^_</span> </p>\n",
21
 "<p>Add skip connection </p>\n": "<p>\u0db8\u0d9f\u0dc4\u0dd0\u0dbb\u0dd3\u0db8\u0dda \u0dc3\u0db8\u0dca\u0db6\u0db1\u0dca\u0db0\u0dad\u0dcf\u0dc0\u0dba \u0d91\u0d9a\u0dca \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
22
 "<p>Add the shortcut connection and return </p>\n": "<p>\u0d9a\u0dd9\u0da7\u0dd2\u0db8\u0d82\u0dc3\u0db8\u0dca\u0db6\u0db1\u0dca\u0db0\u0dad\u0dcf\u0dc0\u0dba \u0d91\u0d9a\u0dad\u0dd4 \u0d9a\u0dbb \u0d86\u0db4\u0dc3\u0dd4 \u0dba\u0db1\u0dca\u0db1 </p>\n",
23
 "<p>Add time embeddings </p>\n": "<p>\u0d9a\u0dcf\u0dbd\u0d9a\u0dcf\u0dc0\u0dd0\u0daf\u0dca\u0daf\u0dd3\u0db8\u0dca \u0d91\u0d9a\u0dad\u0dd4 \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
24
 "<p>Calculate scaled dot-product <span translate=no>_^_0_^_</span> </p>\n": "<p>\u0db4\u0dbb\u0dd2\u0db8\u0dcf\u0dab\u0dad\u0dd2\u0dad\u0dca \u0db1\u0dd2\u0dc2\u0dca\u0db4\u0dcf\u0daf\u0db1\u0dba\u0d9a\u0dca \u0d9c\u0dab\u0db1\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1 <span translate=no>_^_0_^_</span> </p>\n",
25
 "<p>Change <span translate=no>_^_0_^_</span> to shape <span translate=no>_^_1_^_</span> </p>\n": "<p><span translate=no>_^_0_^_</span> \u0dc4\u0dd0\u0da9\u0dba\u0da7 \u0dc0\u0dd9\u0db1\u0dc3\u0dca \u0d9a\u0dbb\u0db1\u0dca\u0db1 <span translate=no>_^_1_^_</span> </p>\n",
26
 "<p>Change to shape <span translate=no>_^_0_^_</span> </p>\n": "<p>\u0dc4\u0dd0\u0da9\u0dba\u0da7\u0dc0\u0dd9\u0db1\u0dc3\u0dca \u0d9a\u0dbb\u0db1\u0dca\u0db1 <span translate=no>_^_0_^_</span> </p>\n",
27
 "<p>Combine the set of modules </p>\n": "<p>\u0db8\u0ddc\u0da9\u0dd2\u0dba\u0dd4\u0dbd\u0d9a\u0da7\u0dca\u0da7\u0dbd\u0dba \u0d92\u0d9a\u0dcf\u0db6\u0daf\u0dca\u0db0 \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
28
 "<p>Create sinusoidal position embeddings <a href=\"../../transformers/positional_encoding.html\">same as those from the transformer</a></p>\n<span translate=no>_^_0_^_</span><p>where <span translate=no>_^_1_^_</span> is <span translate=no>_^_2_^_</span> </p>\n": "<p><a href=\"../../transformers/positional_encoding.html\">\u0da7\u0dca\u0dbb\u0dcf\u0db1\u0dca\u0dc3\u0dca\u0dc6\u0ddd\u0db8\u0dbb\u0dba\u0da7 \u0dc3\u0db8\u0dcf\u0db1</a>\u0dc3\u0dba\u0dd2\u0db1\u0ddc\u0dc3\u0ddc\u0dba\u0dd2\u0da9\u0dbd\u0dca \u0dc3\u0dca\u0dae\u0dcf\u0db1 \u0d9a\u0dcf\u0dc0\u0dd0\u0daf\u0dca\u0daf\u0dd3\u0db8\u0dca \u0dc3\u0dcf\u0daf\u0db1\u0dca\u0db1</p>\n<span translate=no>_^_0_^_</span><p><span translate=no>_^_1_^_</span> \u0d9a\u0ddc\u0dc4\u0dda\u0daf <span translate=no>_^_2_^_</span> </p>\n",
29
 "<p>Default <span translate=no>_^_0_^_</span> </p>\n": "<p>\u0db4\u0dd9\u0dbb\u0db1\u0dd2\u0db8\u0dd2 <span translate=no>_^_0_^_</span> </p>\n",
30
 "<p>Down sample at all resolutions except the last </p>\n": "<p>\u0db4\u0dc3\u0dd4\u0d9c\u0dd2\u0dba\u0dc4\u0dd0\u0dbb \u0d85\u0db1\u0dd9\u0d9a\u0dd4\u0dad\u0dca \u0dc3\u0dd2\u0dba\u0dbd\u0dd4 \u0dba\u0ddd\u0da2\u0db1\u0dcf \u0daf\u0dd3 \u0d86\u0daf\u0dbb\u0dca\u0dc1 \u0db4\u0dc4\u0dc5 </p>\n",
31
 "<p>Final block to reduce the number of channels </p>\n": "<p>\u0db1\u0dcf\u0dbd\u0dd2\u0d9a\u0dcf\u0d9c\u0dab\u0db1 \u0d85\u0da9\u0dd4 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0dc3\u0db3\u0dc4\u0dcf \u0d85\u0dc0\u0dc3\u0dcf\u0db1 \u0d9a\u0ddc\u0da7\u0dc3 </p>\n",
32
 "<p>Final normalization and convolution </p>\n": "<p>\u0d85\u0dc0\u0dc3\u0dcf\u0db1\u0dc3\u0dcf\u0db8\u0dcf\u0db1\u0dca\u0dba\u0d9a\u0dbb\u0dab\u0dba \u0dc3\u0dc4 \u0d9a\u0dd0\u0da7\u0dd2 \u0d9a\u0dd2\u0dbb\u0dd3\u0db8 </p>\n",
33
 "<p>Final normalization and convolution layer </p>\n": "<p>\u0d85\u0dc0\u0dc3\u0dcf\u0db1\u0dc3\u0dcf\u0db8\u0dcf\u0db1\u0dca\u0dba\u0d9a\u0dbb\u0dab\u0dba \u0dc3\u0dc4 \u0d9a\u0dd0\u0da7\u0dd2 \u0d9c\u0dd0\u0dc3\u0dd4\u0dab\u0dd4 \u0dc3\u0dca\u0dae\u0dbb\u0dba </p>\n",
34
 "<p>First convolution layer </p>\n": "<p>\u0db4\u0dc5\u0db8\u0dd4\u0d9a\u0dd0\u0da7\u0dd2 \u0d9c\u0dd0\u0dc3\u0dd4\u0dab\u0dd4 \u0dc3\u0dca\u0dae\u0dbb\u0dba </p>\n",
35
 "<p>First half of U-Net </p>\n": "<p>\u0dba\u0dd6-\u0db1\u0dd9\u0da7\u0dca\u0dc4\u0dd2 \u0db4\u0dc5\u0db8\u0dd4 \u0db7\u0dcf\u0d9c\u0dba </p>\n",
36
 "<p>First linear layer </p>\n": "<p>\u0db4\u0dc5\u0db8\u0dd4\u0dbb\u0dda\u0d9b\u0dd3\u0dba \u0dc3\u0dca\u0dae\u0dbb\u0dba </p>\n",
37
 "<p>For each resolution </p>\n": "<p>\u0d91\u0d9a\u0dca\u0d91\u0d9a\u0dca \u0dba\u0ddd\u0da2\u0db1\u0dcf\u0dc0 \u0dc3\u0db3\u0dc4\u0dcf </p>\n",
38
 "<p>Get image projection </p>\n": "<p>\u0dbb\u0dd6\u0db4\u0db4\u0dca\u0dbb\u0d9a\u0dca\u0dc2\u0dda\u0db4\u0dab\u0dba \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1 </p>\n",
39
 "<p>Get query, key, and values (concatenated) and shape it to <span translate=no>_^_0_^_</span> </p>\n": "<p>\u0dc0\u0dd2\u0db8\u0dc3\u0dd4\u0db8\u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1, \u0dba\u0dad\u0dd4\u0dbb, \u0dc3\u0dc4 \u0d85\u0d9c\u0dba\u0db1\u0dca (concatenated) \u0dc3\u0dc4 \u0d91\u0dba \u0dc4\u0dd0\u0da9\u0d9c\u0dc3\u0dca\u0dc0\u0dcf <span translate=no>_^_0_^_</span> </p>\n",
40
 "<p>Get shape </p>\n": "<p>\u0dc4\u0dd0\u0da9\u0dba\u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1 </p>\n",
41
 "<p>Get the skip connection from first half of U-Net and concatenate </p>\n": "<p>\u0dba\u0dd6-\u0db1\u0dd9\u0da7\u0dca\u0dc4\u0dd2 \u0db4\u0dc5\u0db8\u0dd4 \u0db7\u0dcf\u0d9c\u0dba\u0dda \u0dc3\u0dd2\u0da7 \u0db8\u0d9f \u0dc4\u0dd0\u0dbb\u0dd3\u0db8\u0dda \u0dc3\u0db8\u0dca\u0db6\u0db1\u0dca\u0db0\u0dad\u0dcf\u0dc0\u0dba \u0dbd\u0db6\u0dcf\u0d9c\u0dd9\u0db1 \u0dc3\u0d82\u0dba\u0dd4\u0d9a\u0dca\u0dad \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
42
 "<p>Get time-step embeddings </p>\n": "<p>\u0d9a\u0dcf\u0dbd-\u0db4\u0dd2\u0dba\u0dc0\u0dbb\u0d9a\u0dcf\u0dc0\u0dd0\u0daf\u0dca\u0daf\u0dd3\u0db8\u0dca \u0dbd\u0db6\u0dcf \u0d9c\u0db1\u0dca\u0db1 </p>\n",
43
 "<p>Group normalization and the first convolution layer </p>\n": "<p>\u0d9a\u0dab\u0dca\u0da9\u0dcf\u0dba\u0db8\u0dca\u0dc3\u0dcf\u0db8\u0dcf\u0db1\u0dca\u0dba\u0d9a\u0dbb\u0dab\u0dba \u0dc3\u0dc4 \u0db4\u0dc5\u0db8\u0dd4 \u0d9a\u0dd0\u0da7\u0dd2 \u0d9c\u0dd0\u0dc3\u0dd4\u0dab\u0dd4 \u0dc3\u0dca\u0dae\u0dbb\u0dba </p>\n",
44
 "<p>Group normalization and the second convolution layer </p>\n": "<p>\u0d9a\u0dab\u0dca\u0da9\u0dcf\u0dba\u0db8\u0dca\u0dc3\u0dcf\u0db8\u0dcf\u0db1\u0dca\u0dba\u0d9a\u0dbb\u0dab\u0dba \u0dc3\u0dc4 \u0daf\u0dd9\u0dc0\u0db1 \u0d9a\u0dd0\u0da7\u0dd2 \u0d9c\u0dd0\u0dc3\u0dd4\u0dab\u0dd4 \u0dc3\u0dca\u0dad\u0dbb\u0dba </p>\n",
45
 "<p>If the number of input channels is not equal to the number of output channels we have to project the shortcut connection </p>\n": "<p>\u0d86\u0daf\u0dcf\u0db1\u0db1\u0dcf\u0dbd\u0dd2\u0d9a\u0dcf \u0d9c\u0dab\u0db1 \u0db4\u0dca\u0dbb\u0dad\u0dd2\u0daf\u0dcf\u0db1 \u0db1\u0dcf\u0dbd\u0dd2\u0d9a\u0dcf \u0d9c\u0dab\u0db1\u0da7 \u0dc3\u0db8\u0dcf\u0db1 \u0db1\u0ddc\u0dc0\u0dda \u0db1\u0db8\u0dca \u0d9a\u0dd9\u0da7\u0dd2\u0db8\u0d82 \u0dc3\u0db8\u0dca\u0db6\u0db1\u0dca\u0db0\u0dad\u0dcf\u0dc0\u0dba \u0db4\u0dca\u0dbb\u0d9a\u0dca\u0dc2\u0dda\u0db4\u0dab\u0dba \u0d9a\u0dc5 \u0dba\u0dd4\u0dad\u0dd4\u0dba </p>\n",
46
 "<p>Linear layer for final transformation </p>\n": "<p>\u0d85\u0dc0\u0dc3\u0dcf\u0db1\u0db4\u0dbb\u0dd2\u0dc0\u0dbb\u0dca\u0dad\u0db1\u0dba \u0dc3\u0db3\u0dc4\u0dcf \u0dbb\u0dda\u0d9b\u0dd3\u0dba \u0dc3\u0dca\u0dae\u0dbb\u0dba </p>\n",
47
 "<p>Linear layer for time embeddings </p>\n": "<p>\u0d9a\u0dcf\u0dbd\u0d9a\u0dcf\u0dc0\u0dd0\u0daf\u0dca\u0daf\u0dd3\u0db8\u0dca \u0dc3\u0db3\u0dc4\u0dcf \u0dbb\u0dda\u0d9b\u0dd3\u0dba \u0dc3\u0dca\u0dae\u0dbb\u0dba </p>\n",
48
 "<p>Middle (bottom) </p>\n": "<p>\u0db8\u0dd0\u0daf(\u0db4\u0dc4\u0dc5) </p>\n",
49
 "<p>Middle block </p>\n": "<p>\u0db8\u0dd0\u0daf\u0d9a\u0ddc\u0da7\u0dc3 </p>\n",
50
 "<p>Multiply by values </p>\n": "<p>\u0d85\u0d9c\u0dba\u0db1\u0dca\u0d85\u0db1\u0dd4\u0dc0 \u0d9c\u0dd4\u0dab \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
51
 "<p>Normalization layer </p>\n": "<p>\u0dc3\u0dcf\u0db8\u0dcf\u0db1\u0dca\u0dba\u0d9a\u0dbb\u0dab\u0dba\u0dc3\u0dca\u0dae\u0dbb\u0dba </p>\n",
52
 "<p>Number of channels </p>\n": "<p>\u0db1\u0dcf\u0dbd\u0dd2\u0d9a\u0dcf\u0d9c\u0dab\u0db1 </p>\n",
53
 "<p>Number of output channels at this resolution </p>\n": "<p>\u0db8\u0dd9\u0db8\u0dc0\u0dd2\u0db7\u0dda\u0daf\u0db1\u0dba\u0dda \u0db4\u0dca\u0dbb\u0dad\u0dd2\u0daf\u0dcf\u0db1 \u0db1\u0dcf\u0dbd\u0dd2\u0d9a\u0dcf \u0d9c\u0dab\u0db1 </p>\n",
54
 "<p>Number of resolutions </p>\n": "<p>\u0dba\u0ddd\u0da2\u0db1\u0dcf\u0d9c\u0dab\u0db1 </p>\n",
55
 "<p>Project image into feature map </p>\n": "<p>\u0dc0\u0dd2\u0dc1\u0dda\u0dc2\u0dcf\u0d82\u0d9c\u0dc3\u0dd2\u0dad\u0dd2\u0dba\u0db8\u0da7 \u0dc0\u0dca\u0dba\u0dcf\u0db4\u0dd8\u0dad\u0dd2 \u0dbb\u0dd6\u0db4\u0dba </p>\n",
56
 "<p>Projections for query, key and values </p>\n": "<p>\u0dc0\u0dd2\u0db8\u0dc3\u0dd4\u0db8, \u0dba\u0dad\u0dd4\u0dbb \u0dc3\u0dc4 \u0d85\u0d9c\u0dba\u0db1\u0dca \u0dc3\u0db3\u0dc4\u0dcf \u0db4\u0dca\u0dbb\u0d9a\u0dca\u0dc2\u0dda\u0db4\u0dab </p>\n",
57
 "<p>Reshape to <span translate=no>_^_0_^_</span> </p>\n": "<p>\u0db1\u0dd0\u0dc0\u0dad\u0dc4\u0dd0\u0da9\u0d9c\u0dc3\u0dca\u0dc0\u0db1\u0dca\u0db1 <span translate=no>_^_0_^_</span> </p>\n",
58
 "<p>Scale for dot-product attention </p>\n": "<p>\u0dad\u0dd2\u0dad\u0dca\u0db1\u0dd2\u0dc2\u0dca\u0db4\u0dcf\u0daf\u0db1 \u0d85\u0dc0\u0db0\u0dcf\u0db1\u0dba \u0dc3\u0db3\u0dc4\u0dcf \u0db4\u0dbb\u0dd2\u0db8\u0dcf\u0dab\u0dba </p>\n",
59
 "<p>Second convolution layer </p>\n": "<p>\u0daf\u0dd9\u0dc0\u0db1\u0d9a\u0dd0\u0da7\u0dd2 \u0d9c\u0dd0\u0dc3\u0dd4\u0dab\u0dd4 \u0dc3\u0dca\u0dae\u0dbb\u0dba </p>\n",
60
 "<p>Second half of U-Net </p>\n": "<p>\u0dba\u0dd6-\u0db1\u0dd9\u0da7\u0dca\u0dc4\u0dd2 \u0daf\u0dd9\u0dc0\u0db1 \u0db7\u0dcf\u0d9c\u0dba </p>\n",
61
 "<p>Second linear layer </p>\n": "<p>\u0daf\u0dd9\u0dc0\u0db1\u0dbb\u0dda\u0d9b\u0dd3\u0dba \u0dc3\u0dca\u0dae\u0dbb\u0dba </p>\n",
62
 "<p>Softmax along the sequence dimension <span translate=no>_^_0_^_</span> </p>\n": "<p>\u0d85\u0db1\u0dd4\u0d9a\u0dca\u0dbb\u0db8\u0dd2\u0d9a\u0db8\u0dcf\u0db1\u0dba \u0d94\u0dc3\u0dca\u0dc3\u0dda \u0dc3\u0ddc\u0dc6\u0dca\u0da7\u0dca\u0db8\u0dd0\u0d9a\u0dca\u0dc3\u0dca <span translate=no>_^_0_^_</span> </p>\n",
63
 "<p>Split query, key, and values. Each of them will have shape <span translate=no>_^_0_^_</span> </p>\n": "<p>\u0dc0\u0dd2\u0db8\u0dc3\u0dd4\u0db8, \u0dba\u0dad\u0dd4\u0dbb \u0dc3\u0dc4 \u0d85\u0d9c\u0dba\u0db1\u0dca \u0db6\u0dd9\u0daf\u0dd3\u0db8\u0dca. \u0d94\u0dc0\u0dd4\u0db1\u0dca \u0d91\u0d9a\u0dca \u0d91\u0d9a\u0dca \u0dc4\u0dd0\u0da9\u0dba \u0d87\u0dad <span translate=no>_^_0_^_</span> </p>\n",
64
 "<p>The input has <span translate=no>_^_0_^_</span> because we concatenate the output of the same resolution from the first half of the U-Net </p>\n": "<p>\u0d86\u0daf\u0dcf\u0db1\u0dba\u0da7\u0d87\u0dad\u0dca\u0dad\u0dda \u0dba\u0dd6-\u0db1\u0dd9\u0da7\u0dca \u0dc4\u0dd2 \u0db4\u0dc5\u0db8\u0dd4 \u0db7\u0dcf\u0d9c\u0dba\u0dda \u0dc3\u0dd2\u0da7 \u0d91\u0d9a\u0db8 \u0dc0\u0dd2\u0db7\u0dda\u0daf\u0db1\u0dba\u0dda \u0db4\u0dca\u0dbb\u0dad\u0dd2\u0daf\u0dcf\u0db1\u0dba \u0d85\u0db4 \u0dc3\u0d82\u0dba\u0dd4\u0d9a\u0dca\u0dad \u0d9a\u0dbb\u0db1 <span translate=no>_^_0_^_</span> \u0db6\u0dd0\u0dc0\u0dd2\u0db1\u0dd2 </p>\n",
65
 "<p>Time embedding layer. Time embedding has <span translate=no>_^_0_^_</span> channels </p>\n": "<p>\u0d9a\u0dcf\u0dbd\u0dba\u0d9a\u0dcf\u0dc0\u0dd0\u0daf\u0dca\u0daf\u0dd3\u0db8 \u0dc3\u0dca\u0dae\u0dbb\u0dba. \u0d9a\u0dcf\u0dbd \u0d9a\u0dcf\u0dc0\u0dd0\u0daf\u0dca\u0daf\u0dd3\u0db8 <span translate=no>_^_0_^_</span> \u0db1\u0dcf\u0dbd\u0dd2\u0d9a\u0dcf \u0d87\u0dad </p>\n",
66
 "<p>Transform to <span translate=no>_^_0_^_</span> </p>\n": "<p>\u0db6\u0dc0\u0da7\u0db4\u0dbb\u0dd2\u0dc0\u0dbb\u0dca\u0dad\u0db1\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1 <span translate=no>_^_0_^_</span> </p>\n",
67
 "<p>Transform with the MLP </p>\n": "<p>\u0d91\u0db8\u0dca\u0d91\u0dbd\u0dca\u0db4\u0dd3\u0dc3\u0db8\u0d9f \u0db4\u0dbb\u0dd2\u0dc0\u0dbb\u0dca\u0dad\u0db1\u0dba \u0d9a\u0dbb\u0db1\u0dca\u0db1 </p>\n",
68
 "<p>Up sample at all resolutions except last </p>\n": "<p>\u0db4\u0dc3\u0dd4\u0d9c\u0dd2\u0dba\u0dc4\u0dd0\u0dbb \u0d85\u0db1\u0dd9\u0d9a\u0dd4\u0dad\u0dca \u0dc3\u0dd2\u0dba\u0dbd\u0dd4 \u0dba\u0ddd\u0da2\u0db1\u0dcf \u0daf\u0dd3 \u0d86\u0daf\u0dbb\u0dca\u0dc1 \u0daf\u0d9a\u0dca\u0dc0\u0dcf </p>\n",
69
 "<ul><li><span translate=no>_^_0_^_</span> has shape <span translate=no>_^_1_^_</span> </li>\n<li><span translate=no>_^_2_^_</span> has shape <span translate=no>_^_3_^_</span></li></ul>\n": "<ul><li><span translate=no>_^_0_^_</span> \u0dc4\u0dd0\u0da9\u0dba \u0d87\u0dad <span translate=no>_^_1_^_</span> </li>\n<li><span translate=no>_^_2_^_</span> \u0dc4\u0dd0\u0da9\u0dba \u0d87\u0dad <span translate=no>_^_3_^_</span></li></ul>\n",
70
 "<ul><li><span translate=no>_^_0_^_</span> is the number of channels in the image. <span translate=no>_^_1_^_</span> for RGB. </li>\n<li><span translate=no>_^_2_^_</span> is number of channels in the initial feature map that we transform the image into </li>\n<li><span translate=no>_^_3_^_</span> is the list of channel numbers at each resolution. The number of channels is <span translate=no>_^_4_^_</span> </li>\n<li><span translate=no>_^_5_^_</span> is a list of booleans that indicate whether to use attention at each resolution </li>\n<li><span translate=no>_^_6_^_</span> is the number of <span translate=no>_^_7_^_</span> at each resolution</li></ul>\n": "<ul><li><span translate=no>_^_0_^_</span> \u0dba\u0db1\u0dd4 \u0dbb\u0dd6\u0db4\u0dba\u0dda \u0db1\u0dcf\u0dbd\u0dd2\u0d9a\u0dcf \u0d9c\u0dab\u0db1. <span translate=no>_^_1_^_</span> RGB \u0dc3\u0db3\u0dc4\u0dcf. </li>\n<li><span translate=no>_^_2_^_</span> \u0d86\u0dbb\u0db8\u0dca\u0db7\u0d9a \u0dc0\u0dd2\u0dc1\u0dda\u0dc2\u0dcf\u0d82\u0d9c \u0dc3\u0dd2\u0dad\u0dd2\u0dba\u0db8\u0dda \u0db1\u0dcf\u0dbd\u0dd2\u0d9a\u0dcf \u0d9c\u0dab\u0db1 \u0d85\u0db4\u0dd2 \u0dbb\u0dd6\u0db4\u0dba \u0db6\u0dc0\u0da7 \u0db4\u0dbb\u0dd2\u0dc0\u0dbb\u0dca\u0dad\u0db1\u0dba \u0d9a\u0dbb\u0db8\u0dd4 </li>\n<li><span translate=no>_^_3_^_</span> \u0dba\u0db1\u0dd4 \u0d91\u0d9a\u0dca \u0d91\u0d9a\u0dca \u0dc0\u0dd2\u0db7\u0dda\u0daf\u0db1\u0dba\u0dda \u0db1\u0dcf\u0dbd\u0dd2\u0d9a\u0dcf \u0d85\u0d82\u0d9a \u0dbd\u0dd0\u0dba\u0dd2\u0dc3\u0dca\u0dad\u0dd4\u0dc0\u0dba\u0dd2. \u0db1\u0dcf\u0dbd\u0dd2\u0d9a\u0dcf \u0d9c\u0dab\u0db1 \u0dc0\u0dda <span translate=no>_^_4_^_</span> </li>\n<li><span translate=no>_^_5_^_</span> \u0dba\u0db1\u0dd4 \u0d91\u0d9a\u0dca \u0d91\u0d9a\u0dca \u0dc0\u0dd2\u0db7\u0dda\u0daf\u0db1\u0dba\u0dda \u0daf\u0dd3 \u0d85\u0dc0\u0db0\u0dcf\u0db1\u0dba \u0dba\u0ddc\u0db8\u0dd4 \u0d9a\u0dc5 \u0dba\u0dd4\u0dad\u0dd4\u0daf \u0dba\u0db1\u0dca\u0db1 \u0db4\u0dd9\u0db1\u0dca\u0db1\u0dd4\u0db8\u0dca \u0d9a\u0dbb\u0db1 \u0db6\u0dd6\u0dbd\u0dd2\u0dba\u0db1\u0dca \u0dbd\u0dd0\u0dba\u0dd2\u0dc3\u0dca\u0dad\u0dd4\u0dc0\u0d9a\u0dd2 </li>\n<li><span translate=no>_^_6_^_</span> \u0d91\u0d9a\u0dca \u0d91\u0d9a\u0dca \u0dba\u0ddd\u0da2\u0db1\u0dcf\u0dc0 <span translate=no>_^_7_^_</span> \u0daf\u0dd3 \u0dc3\u0d82\u0d9b\u0dca\u0dba\u0dcf\u0dc0 \u0dc0\u0dda</li></ul>\n",
71
 "<ul><li><span translate=no>_^_0_^_</span> is the number of channels in the input </li>\n<li><span translate=no>_^_1_^_</span> is the number of heads in multi-head attention </li>\n<li><span translate=no>_^_2_^_</span> is the number of dimensions in each head </li>\n<li><span translate=no>_^_3_^_</span> is the number of groups for <a href=\"../../normalization/group_norm/index.html\">group normalization</a></li></ul>\n": "<ul><li><span translate=no>_^_0_^_</span> \u0dba\u0db1\u0dd4 \u0d86\u0daf\u0dcf\u0db1\u0dba\u0dda \u0db1\u0dcf\u0dbd\u0dd2\u0d9a\u0dcf \u0d9c\u0dab\u0db1 </li>\n<li><span translate=no>_^_1_^_</span> \u0db6\u0dc4\u0dd4-\u0dc4\u0dd2\u0dc3 \u0d85\u0dc0\u0db0\u0dcf\u0db1\u0dba \u0dba\u0ddc\u0db8\u0dd4 \u0db4\u0dca\u0dbb\u0db0\u0dcf\u0db1\u0dd3\u0db1\u0dca \u0dc3\u0d82\u0d9b\u0dca\u0dba\u0dcf\u0dc0 \u0dc0\u0dda </li>\n<li><span translate=no>_^_2_^_</span> \u0d91\u0d9a\u0dca \u0d91\u0d9a\u0dca \u0dc4\u0dd2\u0dc3\u0dd9\u0dc4\u0dd2 \u0db8\u0dcf\u0db1\u0dba\u0db1\u0dca \u0d9c\u0dab\u0db1 </li>\n</ul><li><span translate=no>_^_3_^_</span> \u0d9a\u0dab\u0dca\u0da9\u0dcf\u0dba\u0db8\u0dca <a href=\"../../normalization/group_norm/index.html\">\u0dc3\u0dcf\u0db8\u0dcf\u0db1\u0dca\u0dba\u0d9a\u0dbb\u0dab\u0dba \u0dc3\u0db3\u0dc4\u0dcf \u0d9a\u0dab\u0dca\u0da9\u0dcf\u0dba\u0db8\u0dca</a>\u0dc3\u0d82\u0d9b\u0dca\u0dba\u0dcf\u0dc0 \u0dc0\u0dda</li>\n",
72
 "<ul><li><span translate=no>_^_0_^_</span> is the number of dimensions in the embedding</li></ul>\n": "<ul><li><span translate=no>_^_0_^_</span> \u0d9a\u0dcf\u0dc0\u0dd0\u0daf\u0dca\u0daf\u0dd3\u0db8\u0dda \u0db8\u0dcf\u0db1\u0dba\u0db1\u0dca \u0d9c\u0dab\u0db1 \u0dc0\u0dda</li></ul>\n",
73
 "<ul><li><span translate=no>_^_0_^_</span> is the number of input channels </li>\n<li><span translate=no>_^_1_^_</span> is the number of input channels </li>\n<li><span translate=no>_^_2_^_</span> is the number channels in the time step (<span translate=no>_^_3_^_</span>) embeddings </li>\n<li><span translate=no>_^_4_^_</span> is the number of groups for <a href=\"../../normalization/group_norm/index.html\">group normalization</a> </li>\n<li><span translate=no>_^_5_^_</span> is the dropout rate</li></ul>\n": "<ul><li><span translate=no>_^_0_^_</span>\u0d86\u0daf\u0dcf\u0db1 \u0db1\u0dcf\u0dbd\u0dd2\u0d9a\u0dcf \u0d9c\u0dab\u0db1</li>\n<li><span translate=no>_^_1_^_</span>\u0d86\u0daf\u0dcf\u0db1 \u0db1\u0dcf\u0dbd\u0dd2\u0d9a\u0dcf \u0d9c\u0dab\u0db1</li>\n<li><span translate=no>_^_2_^_</span>\u0d9a\u0dcf\u0dbd\u0dba \u0db4\u0dd2\u0dba\u0dc0\u0dbb (<span translate=no>_^_3_^_</span>) \u0d9a\u0dcf\u0dc0\u0dd0\u0daf\u0dca\u0daf\u0dd3\u0db8\u0dca \u0dc3\u0d82\u0d9b\u0dca\u0dba\u0dcf\u0dc0 \u0db1\u0dcf\u0dbd\u0dd2\u0d9a\u0dcf \u0dc0\u0dda</li>\n<li><span translate=no>_^_4_^_</span>\u0d9a\u0dab\u0dca\u0da9\u0dcf\u0dba\u0db8\u0dca <a href=\"../../normalization/group_norm/index.html\">\u0dc3\u0dcf\u0db8\u0dcf\u0db1\u0dca\u0dba\u0d9a\u0dbb\u0dab\u0dba \u0dc3\u0db3\u0dc4\u0dcf \u0d9a\u0dab\u0dca\u0da9\u0dcf\u0dba\u0db8\u0dca</a> \u0dc3\u0d82\u0d9b\u0dca\u0dba\u0dcf\u0dc0 \u0dc0\u0dda</li>\n</ul><li><span translate=no>_^_5_^_</span>\u0dc4\u0dd0\u0dbd\u0dc4\u0dd0\u0db4\u0dca\u0db8\u0dda \u0d85\u0db1\u0dd4\u0db4\u0dcf\u0dad\u0dba \u0dc0\u0dda</li>\n",
74
 "U-Net model for Denoising Diffusion Probabilistic Models (DDPM)": "\u0dc0\u0dd2\u0dc3\u0dbb\u0dab \u0dc3\u0db8\u0dca\u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf \u0d86\u0d9a\u0dd8\u0dad\u0dd2 \u0db1\u0dd2\u0dbb\u0dd6\u0db4\u0dab\u0dba \u0d9a\u0dd2\u0dbb\u0dd3\u0db8 \u0dc3\u0db3\u0dc4\u0dcf \u0dba\u0dd6-\u0db1\u0dd9\u0da7\u0dca \u0d86\u0d9a\u0dd8\u0dad\u0dd2\u0dba (\u0da9\u0dd3\u0da9\u0dd3\u0db4\u0dd3\u0d91\u0db8\u0dca)",
75
 "UNet model for Denoising Diffusion Probabilistic Models (DDPM)": "Denoising Diffusion \u0dc3\u0db8\u0dca\u0db7\u0dcf\u0dc0\u0dd2\u0dad\u0dcf\u0dc0 \u0d86\u0d9a\u0dd8\u0dad\u0dd2 \u0dc3\u0db3\u0dc4\u0dcf UNET \u0d86\u0d9a\u0dd8\u0dad\u0dd2\u0dba (DDPM)"
76
}
77
Product

Resources

Company