Book a Demo!
CoCalc Logo Icon
StoreFeaturesDocsShareSupportNewsAboutPoliciesSign UpSign In
freebsd
GitHub Repository: freebsd/freebsd-src
Path: blob/main/sys/crypto/openssl/amd64/sha1-mb-x86_64.S
39482 views
1
/* Do not modify. This file is auto-generated from sha1-mb-x86_64.pl. */
2
.text
3
4
5
6
.globl sha1_multi_block
7
.type sha1_multi_block,@function
8
.align 32
9
sha1_multi_block:
10
.cfi_startproc
11
movq OPENSSL_ia32cap_P+4(%rip),%rcx
12
btq $61,%rcx
13
jc _shaext_shortcut
14
testl $268435456,%ecx
15
jnz _avx_shortcut
16
movq %rsp,%rax
17
.cfi_def_cfa_register %rax
18
pushq %rbx
19
.cfi_offset %rbx,-16
20
pushq %rbp
21
.cfi_offset %rbx,-24
22
subq $288,%rsp
23
andq $-256,%rsp
24
movq %rax,272(%rsp)
25
.cfi_escape 0x0f,0x06,0x77,0x90,0x02,0x06,0x23,0x08
26
.Lbody:
27
leaq K_XX_XX(%rip),%rbp
28
leaq 256(%rsp),%rbx
29
30
.Loop_grande:
31
movl %edx,280(%rsp)
32
xorl %edx,%edx
33
34
movq 0(%rsi),%r8
35
36
movl 8(%rsi),%ecx
37
cmpl %edx,%ecx
38
cmovgl %ecx,%edx
39
testl %ecx,%ecx
40
movl %ecx,0(%rbx)
41
cmovleq %rbp,%r8
42
43
movq 16(%rsi),%r9
44
45
movl 24(%rsi),%ecx
46
cmpl %edx,%ecx
47
cmovgl %ecx,%edx
48
testl %ecx,%ecx
49
movl %ecx,4(%rbx)
50
cmovleq %rbp,%r9
51
52
movq 32(%rsi),%r10
53
54
movl 40(%rsi),%ecx
55
cmpl %edx,%ecx
56
cmovgl %ecx,%edx
57
testl %ecx,%ecx
58
movl %ecx,8(%rbx)
59
cmovleq %rbp,%r10
60
61
movq 48(%rsi),%r11
62
63
movl 56(%rsi),%ecx
64
cmpl %edx,%ecx
65
cmovgl %ecx,%edx
66
testl %ecx,%ecx
67
movl %ecx,12(%rbx)
68
cmovleq %rbp,%r11
69
testl %edx,%edx
70
jz .Ldone
71
72
movdqu 0(%rdi),%xmm10
73
leaq 128(%rsp),%rax
74
movdqu 32(%rdi),%xmm11
75
movdqu 64(%rdi),%xmm12
76
movdqu 96(%rdi),%xmm13
77
movdqu 128(%rdi),%xmm14
78
movdqa 96(%rbp),%xmm5
79
movdqa -32(%rbp),%xmm15
80
jmp .Loop
81
82
.align 32
83
.Loop:
84
movd (%r8),%xmm0
85
leaq 64(%r8),%r8
86
movd (%r9),%xmm2
87
leaq 64(%r9),%r9
88
movd (%r10),%xmm3
89
leaq 64(%r10),%r10
90
movd (%r11),%xmm4
91
leaq 64(%r11),%r11
92
punpckldq %xmm3,%xmm0
93
movd -60(%r8),%xmm1
94
punpckldq %xmm4,%xmm2
95
movd -60(%r9),%xmm9
96
punpckldq %xmm2,%xmm0
97
movd -60(%r10),%xmm8
98
.byte 102,15,56,0,197
99
movd -60(%r11),%xmm7
100
punpckldq %xmm8,%xmm1
101
movdqa %xmm10,%xmm8
102
paddd %xmm15,%xmm14
103
punpckldq %xmm7,%xmm9
104
movdqa %xmm11,%xmm7
105
movdqa %xmm11,%xmm6
106
pslld $5,%xmm8
107
pandn %xmm13,%xmm7
108
pand %xmm12,%xmm6
109
punpckldq %xmm9,%xmm1
110
movdqa %xmm10,%xmm9
111
112
movdqa %xmm0,0-128(%rax)
113
paddd %xmm0,%xmm14
114
movd -56(%r8),%xmm2
115
psrld $27,%xmm9
116
pxor %xmm7,%xmm6
117
movdqa %xmm11,%xmm7
118
119
por %xmm9,%xmm8
120
movd -56(%r9),%xmm9
121
pslld $30,%xmm7
122
paddd %xmm6,%xmm14
123
124
psrld $2,%xmm11
125
paddd %xmm8,%xmm14
126
.byte 102,15,56,0,205
127
movd -56(%r10),%xmm8
128
por %xmm7,%xmm11
129
movd -56(%r11),%xmm7
130
punpckldq %xmm8,%xmm2
131
movdqa %xmm14,%xmm8
132
paddd %xmm15,%xmm13
133
punpckldq %xmm7,%xmm9
134
movdqa %xmm10,%xmm7
135
movdqa %xmm10,%xmm6
136
pslld $5,%xmm8
137
pandn %xmm12,%xmm7
138
pand %xmm11,%xmm6
139
punpckldq %xmm9,%xmm2
140
movdqa %xmm14,%xmm9
141
142
movdqa %xmm1,16-128(%rax)
143
paddd %xmm1,%xmm13
144
movd -52(%r8),%xmm3
145
psrld $27,%xmm9
146
pxor %xmm7,%xmm6
147
movdqa %xmm10,%xmm7
148
149
por %xmm9,%xmm8
150
movd -52(%r9),%xmm9
151
pslld $30,%xmm7
152
paddd %xmm6,%xmm13
153
154
psrld $2,%xmm10
155
paddd %xmm8,%xmm13
156
.byte 102,15,56,0,213
157
movd -52(%r10),%xmm8
158
por %xmm7,%xmm10
159
movd -52(%r11),%xmm7
160
punpckldq %xmm8,%xmm3
161
movdqa %xmm13,%xmm8
162
paddd %xmm15,%xmm12
163
punpckldq %xmm7,%xmm9
164
movdqa %xmm14,%xmm7
165
movdqa %xmm14,%xmm6
166
pslld $5,%xmm8
167
pandn %xmm11,%xmm7
168
pand %xmm10,%xmm6
169
punpckldq %xmm9,%xmm3
170
movdqa %xmm13,%xmm9
171
172
movdqa %xmm2,32-128(%rax)
173
paddd %xmm2,%xmm12
174
movd -48(%r8),%xmm4
175
psrld $27,%xmm9
176
pxor %xmm7,%xmm6
177
movdqa %xmm14,%xmm7
178
179
por %xmm9,%xmm8
180
movd -48(%r9),%xmm9
181
pslld $30,%xmm7
182
paddd %xmm6,%xmm12
183
184
psrld $2,%xmm14
185
paddd %xmm8,%xmm12
186
.byte 102,15,56,0,221
187
movd -48(%r10),%xmm8
188
por %xmm7,%xmm14
189
movd -48(%r11),%xmm7
190
punpckldq %xmm8,%xmm4
191
movdqa %xmm12,%xmm8
192
paddd %xmm15,%xmm11
193
punpckldq %xmm7,%xmm9
194
movdqa %xmm13,%xmm7
195
movdqa %xmm13,%xmm6
196
pslld $5,%xmm8
197
pandn %xmm10,%xmm7
198
pand %xmm14,%xmm6
199
punpckldq %xmm9,%xmm4
200
movdqa %xmm12,%xmm9
201
202
movdqa %xmm3,48-128(%rax)
203
paddd %xmm3,%xmm11
204
movd -44(%r8),%xmm0
205
psrld $27,%xmm9
206
pxor %xmm7,%xmm6
207
movdqa %xmm13,%xmm7
208
209
por %xmm9,%xmm8
210
movd -44(%r9),%xmm9
211
pslld $30,%xmm7
212
paddd %xmm6,%xmm11
213
214
psrld $2,%xmm13
215
paddd %xmm8,%xmm11
216
.byte 102,15,56,0,229
217
movd -44(%r10),%xmm8
218
por %xmm7,%xmm13
219
movd -44(%r11),%xmm7
220
punpckldq %xmm8,%xmm0
221
movdqa %xmm11,%xmm8
222
paddd %xmm15,%xmm10
223
punpckldq %xmm7,%xmm9
224
movdqa %xmm12,%xmm7
225
movdqa %xmm12,%xmm6
226
pslld $5,%xmm8
227
pandn %xmm14,%xmm7
228
pand %xmm13,%xmm6
229
punpckldq %xmm9,%xmm0
230
movdqa %xmm11,%xmm9
231
232
movdqa %xmm4,64-128(%rax)
233
paddd %xmm4,%xmm10
234
movd -40(%r8),%xmm1
235
psrld $27,%xmm9
236
pxor %xmm7,%xmm6
237
movdqa %xmm12,%xmm7
238
239
por %xmm9,%xmm8
240
movd -40(%r9),%xmm9
241
pslld $30,%xmm7
242
paddd %xmm6,%xmm10
243
244
psrld $2,%xmm12
245
paddd %xmm8,%xmm10
246
.byte 102,15,56,0,197
247
movd -40(%r10),%xmm8
248
por %xmm7,%xmm12
249
movd -40(%r11),%xmm7
250
punpckldq %xmm8,%xmm1
251
movdqa %xmm10,%xmm8
252
paddd %xmm15,%xmm14
253
punpckldq %xmm7,%xmm9
254
movdqa %xmm11,%xmm7
255
movdqa %xmm11,%xmm6
256
pslld $5,%xmm8
257
pandn %xmm13,%xmm7
258
pand %xmm12,%xmm6
259
punpckldq %xmm9,%xmm1
260
movdqa %xmm10,%xmm9
261
262
movdqa %xmm0,80-128(%rax)
263
paddd %xmm0,%xmm14
264
movd -36(%r8),%xmm2
265
psrld $27,%xmm9
266
pxor %xmm7,%xmm6
267
movdqa %xmm11,%xmm7
268
269
por %xmm9,%xmm8
270
movd -36(%r9),%xmm9
271
pslld $30,%xmm7
272
paddd %xmm6,%xmm14
273
274
psrld $2,%xmm11
275
paddd %xmm8,%xmm14
276
.byte 102,15,56,0,205
277
movd -36(%r10),%xmm8
278
por %xmm7,%xmm11
279
movd -36(%r11),%xmm7
280
punpckldq %xmm8,%xmm2
281
movdqa %xmm14,%xmm8
282
paddd %xmm15,%xmm13
283
punpckldq %xmm7,%xmm9
284
movdqa %xmm10,%xmm7
285
movdqa %xmm10,%xmm6
286
pslld $5,%xmm8
287
pandn %xmm12,%xmm7
288
pand %xmm11,%xmm6
289
punpckldq %xmm9,%xmm2
290
movdqa %xmm14,%xmm9
291
292
movdqa %xmm1,96-128(%rax)
293
paddd %xmm1,%xmm13
294
movd -32(%r8),%xmm3
295
psrld $27,%xmm9
296
pxor %xmm7,%xmm6
297
movdqa %xmm10,%xmm7
298
299
por %xmm9,%xmm8
300
movd -32(%r9),%xmm9
301
pslld $30,%xmm7
302
paddd %xmm6,%xmm13
303
304
psrld $2,%xmm10
305
paddd %xmm8,%xmm13
306
.byte 102,15,56,0,213
307
movd -32(%r10),%xmm8
308
por %xmm7,%xmm10
309
movd -32(%r11),%xmm7
310
punpckldq %xmm8,%xmm3
311
movdqa %xmm13,%xmm8
312
paddd %xmm15,%xmm12
313
punpckldq %xmm7,%xmm9
314
movdqa %xmm14,%xmm7
315
movdqa %xmm14,%xmm6
316
pslld $5,%xmm8
317
pandn %xmm11,%xmm7
318
pand %xmm10,%xmm6
319
punpckldq %xmm9,%xmm3
320
movdqa %xmm13,%xmm9
321
322
movdqa %xmm2,112-128(%rax)
323
paddd %xmm2,%xmm12
324
movd -28(%r8),%xmm4
325
psrld $27,%xmm9
326
pxor %xmm7,%xmm6
327
movdqa %xmm14,%xmm7
328
329
por %xmm9,%xmm8
330
movd -28(%r9),%xmm9
331
pslld $30,%xmm7
332
paddd %xmm6,%xmm12
333
334
psrld $2,%xmm14
335
paddd %xmm8,%xmm12
336
.byte 102,15,56,0,221
337
movd -28(%r10),%xmm8
338
por %xmm7,%xmm14
339
movd -28(%r11),%xmm7
340
punpckldq %xmm8,%xmm4
341
movdqa %xmm12,%xmm8
342
paddd %xmm15,%xmm11
343
punpckldq %xmm7,%xmm9
344
movdqa %xmm13,%xmm7
345
movdqa %xmm13,%xmm6
346
pslld $5,%xmm8
347
pandn %xmm10,%xmm7
348
pand %xmm14,%xmm6
349
punpckldq %xmm9,%xmm4
350
movdqa %xmm12,%xmm9
351
352
movdqa %xmm3,128-128(%rax)
353
paddd %xmm3,%xmm11
354
movd -24(%r8),%xmm0
355
psrld $27,%xmm9
356
pxor %xmm7,%xmm6
357
movdqa %xmm13,%xmm7
358
359
por %xmm9,%xmm8
360
movd -24(%r9),%xmm9
361
pslld $30,%xmm7
362
paddd %xmm6,%xmm11
363
364
psrld $2,%xmm13
365
paddd %xmm8,%xmm11
366
.byte 102,15,56,0,229
367
movd -24(%r10),%xmm8
368
por %xmm7,%xmm13
369
movd -24(%r11),%xmm7
370
punpckldq %xmm8,%xmm0
371
movdqa %xmm11,%xmm8
372
paddd %xmm15,%xmm10
373
punpckldq %xmm7,%xmm9
374
movdqa %xmm12,%xmm7
375
movdqa %xmm12,%xmm6
376
pslld $5,%xmm8
377
pandn %xmm14,%xmm7
378
pand %xmm13,%xmm6
379
punpckldq %xmm9,%xmm0
380
movdqa %xmm11,%xmm9
381
382
movdqa %xmm4,144-128(%rax)
383
paddd %xmm4,%xmm10
384
movd -20(%r8),%xmm1
385
psrld $27,%xmm9
386
pxor %xmm7,%xmm6
387
movdqa %xmm12,%xmm7
388
389
por %xmm9,%xmm8
390
movd -20(%r9),%xmm9
391
pslld $30,%xmm7
392
paddd %xmm6,%xmm10
393
394
psrld $2,%xmm12
395
paddd %xmm8,%xmm10
396
.byte 102,15,56,0,197
397
movd -20(%r10),%xmm8
398
por %xmm7,%xmm12
399
movd -20(%r11),%xmm7
400
punpckldq %xmm8,%xmm1
401
movdqa %xmm10,%xmm8
402
paddd %xmm15,%xmm14
403
punpckldq %xmm7,%xmm9
404
movdqa %xmm11,%xmm7
405
movdqa %xmm11,%xmm6
406
pslld $5,%xmm8
407
pandn %xmm13,%xmm7
408
pand %xmm12,%xmm6
409
punpckldq %xmm9,%xmm1
410
movdqa %xmm10,%xmm9
411
412
movdqa %xmm0,160-128(%rax)
413
paddd %xmm0,%xmm14
414
movd -16(%r8),%xmm2
415
psrld $27,%xmm9
416
pxor %xmm7,%xmm6
417
movdqa %xmm11,%xmm7
418
419
por %xmm9,%xmm8
420
movd -16(%r9),%xmm9
421
pslld $30,%xmm7
422
paddd %xmm6,%xmm14
423
424
psrld $2,%xmm11
425
paddd %xmm8,%xmm14
426
.byte 102,15,56,0,205
427
movd -16(%r10),%xmm8
428
por %xmm7,%xmm11
429
movd -16(%r11),%xmm7
430
punpckldq %xmm8,%xmm2
431
movdqa %xmm14,%xmm8
432
paddd %xmm15,%xmm13
433
punpckldq %xmm7,%xmm9
434
movdqa %xmm10,%xmm7
435
movdqa %xmm10,%xmm6
436
pslld $5,%xmm8
437
pandn %xmm12,%xmm7
438
pand %xmm11,%xmm6
439
punpckldq %xmm9,%xmm2
440
movdqa %xmm14,%xmm9
441
442
movdqa %xmm1,176-128(%rax)
443
paddd %xmm1,%xmm13
444
movd -12(%r8),%xmm3
445
psrld $27,%xmm9
446
pxor %xmm7,%xmm6
447
movdqa %xmm10,%xmm7
448
449
por %xmm9,%xmm8
450
movd -12(%r9),%xmm9
451
pslld $30,%xmm7
452
paddd %xmm6,%xmm13
453
454
psrld $2,%xmm10
455
paddd %xmm8,%xmm13
456
.byte 102,15,56,0,213
457
movd -12(%r10),%xmm8
458
por %xmm7,%xmm10
459
movd -12(%r11),%xmm7
460
punpckldq %xmm8,%xmm3
461
movdqa %xmm13,%xmm8
462
paddd %xmm15,%xmm12
463
punpckldq %xmm7,%xmm9
464
movdqa %xmm14,%xmm7
465
movdqa %xmm14,%xmm6
466
pslld $5,%xmm8
467
pandn %xmm11,%xmm7
468
pand %xmm10,%xmm6
469
punpckldq %xmm9,%xmm3
470
movdqa %xmm13,%xmm9
471
472
movdqa %xmm2,192-128(%rax)
473
paddd %xmm2,%xmm12
474
movd -8(%r8),%xmm4
475
psrld $27,%xmm9
476
pxor %xmm7,%xmm6
477
movdqa %xmm14,%xmm7
478
479
por %xmm9,%xmm8
480
movd -8(%r9),%xmm9
481
pslld $30,%xmm7
482
paddd %xmm6,%xmm12
483
484
psrld $2,%xmm14
485
paddd %xmm8,%xmm12
486
.byte 102,15,56,0,221
487
movd -8(%r10),%xmm8
488
por %xmm7,%xmm14
489
movd -8(%r11),%xmm7
490
punpckldq %xmm8,%xmm4
491
movdqa %xmm12,%xmm8
492
paddd %xmm15,%xmm11
493
punpckldq %xmm7,%xmm9
494
movdqa %xmm13,%xmm7
495
movdqa %xmm13,%xmm6
496
pslld $5,%xmm8
497
pandn %xmm10,%xmm7
498
pand %xmm14,%xmm6
499
punpckldq %xmm9,%xmm4
500
movdqa %xmm12,%xmm9
501
502
movdqa %xmm3,208-128(%rax)
503
paddd %xmm3,%xmm11
504
movd -4(%r8),%xmm0
505
psrld $27,%xmm9
506
pxor %xmm7,%xmm6
507
movdqa %xmm13,%xmm7
508
509
por %xmm9,%xmm8
510
movd -4(%r9),%xmm9
511
pslld $30,%xmm7
512
paddd %xmm6,%xmm11
513
514
psrld $2,%xmm13
515
paddd %xmm8,%xmm11
516
.byte 102,15,56,0,229
517
movd -4(%r10),%xmm8
518
por %xmm7,%xmm13
519
movdqa 0-128(%rax),%xmm1
520
movd -4(%r11),%xmm7
521
punpckldq %xmm8,%xmm0
522
movdqa %xmm11,%xmm8
523
paddd %xmm15,%xmm10
524
punpckldq %xmm7,%xmm9
525
movdqa %xmm12,%xmm7
526
movdqa %xmm12,%xmm6
527
pslld $5,%xmm8
528
prefetcht0 63(%r8)
529
pandn %xmm14,%xmm7
530
pand %xmm13,%xmm6
531
punpckldq %xmm9,%xmm0
532
movdqa %xmm11,%xmm9
533
534
movdqa %xmm4,224-128(%rax)
535
paddd %xmm4,%xmm10
536
psrld $27,%xmm9
537
pxor %xmm7,%xmm6
538
movdqa %xmm12,%xmm7
539
prefetcht0 63(%r9)
540
541
por %xmm9,%xmm8
542
pslld $30,%xmm7
543
paddd %xmm6,%xmm10
544
prefetcht0 63(%r10)
545
546
psrld $2,%xmm12
547
paddd %xmm8,%xmm10
548
.byte 102,15,56,0,197
549
prefetcht0 63(%r11)
550
por %xmm7,%xmm12
551
movdqa 16-128(%rax),%xmm2
552
pxor %xmm3,%xmm1
553
movdqa 32-128(%rax),%xmm3
554
555
movdqa %xmm10,%xmm8
556
pxor 128-128(%rax),%xmm1
557
paddd %xmm15,%xmm14
558
movdqa %xmm11,%xmm7
559
pslld $5,%xmm8
560
pxor %xmm3,%xmm1
561
movdqa %xmm11,%xmm6
562
pandn %xmm13,%xmm7
563
movdqa %xmm1,%xmm5
564
pand %xmm12,%xmm6
565
movdqa %xmm10,%xmm9
566
psrld $31,%xmm5
567
paddd %xmm1,%xmm1
568
569
movdqa %xmm0,240-128(%rax)
570
paddd %xmm0,%xmm14
571
psrld $27,%xmm9
572
pxor %xmm7,%xmm6
573
574
movdqa %xmm11,%xmm7
575
por %xmm9,%xmm8
576
pslld $30,%xmm7
577
paddd %xmm6,%xmm14
578
579
psrld $2,%xmm11
580
paddd %xmm8,%xmm14
581
por %xmm5,%xmm1
582
por %xmm7,%xmm11
583
pxor %xmm4,%xmm2
584
movdqa 48-128(%rax),%xmm4
585
586
movdqa %xmm14,%xmm8
587
pxor 144-128(%rax),%xmm2
588
paddd %xmm15,%xmm13
589
movdqa %xmm10,%xmm7
590
pslld $5,%xmm8
591
pxor %xmm4,%xmm2
592
movdqa %xmm10,%xmm6
593
pandn %xmm12,%xmm7
594
movdqa %xmm2,%xmm5
595
pand %xmm11,%xmm6
596
movdqa %xmm14,%xmm9
597
psrld $31,%xmm5
598
paddd %xmm2,%xmm2
599
600
movdqa %xmm1,0-128(%rax)
601
paddd %xmm1,%xmm13
602
psrld $27,%xmm9
603
pxor %xmm7,%xmm6
604
605
movdqa %xmm10,%xmm7
606
por %xmm9,%xmm8
607
pslld $30,%xmm7
608
paddd %xmm6,%xmm13
609
610
psrld $2,%xmm10
611
paddd %xmm8,%xmm13
612
por %xmm5,%xmm2
613
por %xmm7,%xmm10
614
pxor %xmm0,%xmm3
615
movdqa 64-128(%rax),%xmm0
616
617
movdqa %xmm13,%xmm8
618
pxor 160-128(%rax),%xmm3
619
paddd %xmm15,%xmm12
620
movdqa %xmm14,%xmm7
621
pslld $5,%xmm8
622
pxor %xmm0,%xmm3
623
movdqa %xmm14,%xmm6
624
pandn %xmm11,%xmm7
625
movdqa %xmm3,%xmm5
626
pand %xmm10,%xmm6
627
movdqa %xmm13,%xmm9
628
psrld $31,%xmm5
629
paddd %xmm3,%xmm3
630
631
movdqa %xmm2,16-128(%rax)
632
paddd %xmm2,%xmm12
633
psrld $27,%xmm9
634
pxor %xmm7,%xmm6
635
636
movdqa %xmm14,%xmm7
637
por %xmm9,%xmm8
638
pslld $30,%xmm7
639
paddd %xmm6,%xmm12
640
641
psrld $2,%xmm14
642
paddd %xmm8,%xmm12
643
por %xmm5,%xmm3
644
por %xmm7,%xmm14
645
pxor %xmm1,%xmm4
646
movdqa 80-128(%rax),%xmm1
647
648
movdqa %xmm12,%xmm8
649
pxor 176-128(%rax),%xmm4
650
paddd %xmm15,%xmm11
651
movdqa %xmm13,%xmm7
652
pslld $5,%xmm8
653
pxor %xmm1,%xmm4
654
movdqa %xmm13,%xmm6
655
pandn %xmm10,%xmm7
656
movdqa %xmm4,%xmm5
657
pand %xmm14,%xmm6
658
movdqa %xmm12,%xmm9
659
psrld $31,%xmm5
660
paddd %xmm4,%xmm4
661
662
movdqa %xmm3,32-128(%rax)
663
paddd %xmm3,%xmm11
664
psrld $27,%xmm9
665
pxor %xmm7,%xmm6
666
667
movdqa %xmm13,%xmm7
668
por %xmm9,%xmm8
669
pslld $30,%xmm7
670
paddd %xmm6,%xmm11
671
672
psrld $2,%xmm13
673
paddd %xmm8,%xmm11
674
por %xmm5,%xmm4
675
por %xmm7,%xmm13
676
pxor %xmm2,%xmm0
677
movdqa 96-128(%rax),%xmm2
678
679
movdqa %xmm11,%xmm8
680
pxor 192-128(%rax),%xmm0
681
paddd %xmm15,%xmm10
682
movdqa %xmm12,%xmm7
683
pslld $5,%xmm8
684
pxor %xmm2,%xmm0
685
movdqa %xmm12,%xmm6
686
pandn %xmm14,%xmm7
687
movdqa %xmm0,%xmm5
688
pand %xmm13,%xmm6
689
movdqa %xmm11,%xmm9
690
psrld $31,%xmm5
691
paddd %xmm0,%xmm0
692
693
movdqa %xmm4,48-128(%rax)
694
paddd %xmm4,%xmm10
695
psrld $27,%xmm9
696
pxor %xmm7,%xmm6
697
698
movdqa %xmm12,%xmm7
699
por %xmm9,%xmm8
700
pslld $30,%xmm7
701
paddd %xmm6,%xmm10
702
703
psrld $2,%xmm12
704
paddd %xmm8,%xmm10
705
por %xmm5,%xmm0
706
por %xmm7,%xmm12
707
movdqa 0(%rbp),%xmm15
708
pxor %xmm3,%xmm1
709
movdqa 112-128(%rax),%xmm3
710
711
movdqa %xmm10,%xmm8
712
movdqa %xmm13,%xmm6
713
pxor 208-128(%rax),%xmm1
714
paddd %xmm15,%xmm14
715
pslld $5,%xmm8
716
pxor %xmm11,%xmm6
717
718
movdqa %xmm10,%xmm9
719
movdqa %xmm0,64-128(%rax)
720
paddd %xmm0,%xmm14
721
pxor %xmm3,%xmm1
722
psrld $27,%xmm9
723
pxor %xmm12,%xmm6
724
movdqa %xmm11,%xmm7
725
726
pslld $30,%xmm7
727
movdqa %xmm1,%xmm5
728
por %xmm9,%xmm8
729
psrld $31,%xmm5
730
paddd %xmm6,%xmm14
731
paddd %xmm1,%xmm1
732
733
psrld $2,%xmm11
734
paddd %xmm8,%xmm14
735
por %xmm5,%xmm1
736
por %xmm7,%xmm11
737
pxor %xmm4,%xmm2
738
movdqa 128-128(%rax),%xmm4
739
740
movdqa %xmm14,%xmm8
741
movdqa %xmm12,%xmm6
742
pxor 224-128(%rax),%xmm2
743
paddd %xmm15,%xmm13
744
pslld $5,%xmm8
745
pxor %xmm10,%xmm6
746
747
movdqa %xmm14,%xmm9
748
movdqa %xmm1,80-128(%rax)
749
paddd %xmm1,%xmm13
750
pxor %xmm4,%xmm2
751
psrld $27,%xmm9
752
pxor %xmm11,%xmm6
753
movdqa %xmm10,%xmm7
754
755
pslld $30,%xmm7
756
movdqa %xmm2,%xmm5
757
por %xmm9,%xmm8
758
psrld $31,%xmm5
759
paddd %xmm6,%xmm13
760
paddd %xmm2,%xmm2
761
762
psrld $2,%xmm10
763
paddd %xmm8,%xmm13
764
por %xmm5,%xmm2
765
por %xmm7,%xmm10
766
pxor %xmm0,%xmm3
767
movdqa 144-128(%rax),%xmm0
768
769
movdqa %xmm13,%xmm8
770
movdqa %xmm11,%xmm6
771
pxor 240-128(%rax),%xmm3
772
paddd %xmm15,%xmm12
773
pslld $5,%xmm8
774
pxor %xmm14,%xmm6
775
776
movdqa %xmm13,%xmm9
777
movdqa %xmm2,96-128(%rax)
778
paddd %xmm2,%xmm12
779
pxor %xmm0,%xmm3
780
psrld $27,%xmm9
781
pxor %xmm10,%xmm6
782
movdqa %xmm14,%xmm7
783
784
pslld $30,%xmm7
785
movdqa %xmm3,%xmm5
786
por %xmm9,%xmm8
787
psrld $31,%xmm5
788
paddd %xmm6,%xmm12
789
paddd %xmm3,%xmm3
790
791
psrld $2,%xmm14
792
paddd %xmm8,%xmm12
793
por %xmm5,%xmm3
794
por %xmm7,%xmm14
795
pxor %xmm1,%xmm4
796
movdqa 160-128(%rax),%xmm1
797
798
movdqa %xmm12,%xmm8
799
movdqa %xmm10,%xmm6
800
pxor 0-128(%rax),%xmm4
801
paddd %xmm15,%xmm11
802
pslld $5,%xmm8
803
pxor %xmm13,%xmm6
804
805
movdqa %xmm12,%xmm9
806
movdqa %xmm3,112-128(%rax)
807
paddd %xmm3,%xmm11
808
pxor %xmm1,%xmm4
809
psrld $27,%xmm9
810
pxor %xmm14,%xmm6
811
movdqa %xmm13,%xmm7
812
813
pslld $30,%xmm7
814
movdqa %xmm4,%xmm5
815
por %xmm9,%xmm8
816
psrld $31,%xmm5
817
paddd %xmm6,%xmm11
818
paddd %xmm4,%xmm4
819
820
psrld $2,%xmm13
821
paddd %xmm8,%xmm11
822
por %xmm5,%xmm4
823
por %xmm7,%xmm13
824
pxor %xmm2,%xmm0
825
movdqa 176-128(%rax),%xmm2
826
827
movdqa %xmm11,%xmm8
828
movdqa %xmm14,%xmm6
829
pxor 16-128(%rax),%xmm0
830
paddd %xmm15,%xmm10
831
pslld $5,%xmm8
832
pxor %xmm12,%xmm6
833
834
movdqa %xmm11,%xmm9
835
movdqa %xmm4,128-128(%rax)
836
paddd %xmm4,%xmm10
837
pxor %xmm2,%xmm0
838
psrld $27,%xmm9
839
pxor %xmm13,%xmm6
840
movdqa %xmm12,%xmm7
841
842
pslld $30,%xmm7
843
movdqa %xmm0,%xmm5
844
por %xmm9,%xmm8
845
psrld $31,%xmm5
846
paddd %xmm6,%xmm10
847
paddd %xmm0,%xmm0
848
849
psrld $2,%xmm12
850
paddd %xmm8,%xmm10
851
por %xmm5,%xmm0
852
por %xmm7,%xmm12
853
pxor %xmm3,%xmm1
854
movdqa 192-128(%rax),%xmm3
855
856
movdqa %xmm10,%xmm8
857
movdqa %xmm13,%xmm6
858
pxor 32-128(%rax),%xmm1
859
paddd %xmm15,%xmm14
860
pslld $5,%xmm8
861
pxor %xmm11,%xmm6
862
863
movdqa %xmm10,%xmm9
864
movdqa %xmm0,144-128(%rax)
865
paddd %xmm0,%xmm14
866
pxor %xmm3,%xmm1
867
psrld $27,%xmm9
868
pxor %xmm12,%xmm6
869
movdqa %xmm11,%xmm7
870
871
pslld $30,%xmm7
872
movdqa %xmm1,%xmm5
873
por %xmm9,%xmm8
874
psrld $31,%xmm5
875
paddd %xmm6,%xmm14
876
paddd %xmm1,%xmm1
877
878
psrld $2,%xmm11
879
paddd %xmm8,%xmm14
880
por %xmm5,%xmm1
881
por %xmm7,%xmm11
882
pxor %xmm4,%xmm2
883
movdqa 208-128(%rax),%xmm4
884
885
movdqa %xmm14,%xmm8
886
movdqa %xmm12,%xmm6
887
pxor 48-128(%rax),%xmm2
888
paddd %xmm15,%xmm13
889
pslld $5,%xmm8
890
pxor %xmm10,%xmm6
891
892
movdqa %xmm14,%xmm9
893
movdqa %xmm1,160-128(%rax)
894
paddd %xmm1,%xmm13
895
pxor %xmm4,%xmm2
896
psrld $27,%xmm9
897
pxor %xmm11,%xmm6
898
movdqa %xmm10,%xmm7
899
900
pslld $30,%xmm7
901
movdqa %xmm2,%xmm5
902
por %xmm9,%xmm8
903
psrld $31,%xmm5
904
paddd %xmm6,%xmm13
905
paddd %xmm2,%xmm2
906
907
psrld $2,%xmm10
908
paddd %xmm8,%xmm13
909
por %xmm5,%xmm2
910
por %xmm7,%xmm10
911
pxor %xmm0,%xmm3
912
movdqa 224-128(%rax),%xmm0
913
914
movdqa %xmm13,%xmm8
915
movdqa %xmm11,%xmm6
916
pxor 64-128(%rax),%xmm3
917
paddd %xmm15,%xmm12
918
pslld $5,%xmm8
919
pxor %xmm14,%xmm6
920
921
movdqa %xmm13,%xmm9
922
movdqa %xmm2,176-128(%rax)
923
paddd %xmm2,%xmm12
924
pxor %xmm0,%xmm3
925
psrld $27,%xmm9
926
pxor %xmm10,%xmm6
927
movdqa %xmm14,%xmm7
928
929
pslld $30,%xmm7
930
movdqa %xmm3,%xmm5
931
por %xmm9,%xmm8
932
psrld $31,%xmm5
933
paddd %xmm6,%xmm12
934
paddd %xmm3,%xmm3
935
936
psrld $2,%xmm14
937
paddd %xmm8,%xmm12
938
por %xmm5,%xmm3
939
por %xmm7,%xmm14
940
pxor %xmm1,%xmm4
941
movdqa 240-128(%rax),%xmm1
942
943
movdqa %xmm12,%xmm8
944
movdqa %xmm10,%xmm6
945
pxor 80-128(%rax),%xmm4
946
paddd %xmm15,%xmm11
947
pslld $5,%xmm8
948
pxor %xmm13,%xmm6
949
950
movdqa %xmm12,%xmm9
951
movdqa %xmm3,192-128(%rax)
952
paddd %xmm3,%xmm11
953
pxor %xmm1,%xmm4
954
psrld $27,%xmm9
955
pxor %xmm14,%xmm6
956
movdqa %xmm13,%xmm7
957
958
pslld $30,%xmm7
959
movdqa %xmm4,%xmm5
960
por %xmm9,%xmm8
961
psrld $31,%xmm5
962
paddd %xmm6,%xmm11
963
paddd %xmm4,%xmm4
964
965
psrld $2,%xmm13
966
paddd %xmm8,%xmm11
967
por %xmm5,%xmm4
968
por %xmm7,%xmm13
969
pxor %xmm2,%xmm0
970
movdqa 0-128(%rax),%xmm2
971
972
movdqa %xmm11,%xmm8
973
movdqa %xmm14,%xmm6
974
pxor 96-128(%rax),%xmm0
975
paddd %xmm15,%xmm10
976
pslld $5,%xmm8
977
pxor %xmm12,%xmm6
978
979
movdqa %xmm11,%xmm9
980
movdqa %xmm4,208-128(%rax)
981
paddd %xmm4,%xmm10
982
pxor %xmm2,%xmm0
983
psrld $27,%xmm9
984
pxor %xmm13,%xmm6
985
movdqa %xmm12,%xmm7
986
987
pslld $30,%xmm7
988
movdqa %xmm0,%xmm5
989
por %xmm9,%xmm8
990
psrld $31,%xmm5
991
paddd %xmm6,%xmm10
992
paddd %xmm0,%xmm0
993
994
psrld $2,%xmm12
995
paddd %xmm8,%xmm10
996
por %xmm5,%xmm0
997
por %xmm7,%xmm12
998
pxor %xmm3,%xmm1
999
movdqa 16-128(%rax),%xmm3
1000
1001
movdqa %xmm10,%xmm8
1002
movdqa %xmm13,%xmm6
1003
pxor 112-128(%rax),%xmm1
1004
paddd %xmm15,%xmm14
1005
pslld $5,%xmm8
1006
pxor %xmm11,%xmm6
1007
1008
movdqa %xmm10,%xmm9
1009
movdqa %xmm0,224-128(%rax)
1010
paddd %xmm0,%xmm14
1011
pxor %xmm3,%xmm1
1012
psrld $27,%xmm9
1013
pxor %xmm12,%xmm6
1014
movdqa %xmm11,%xmm7
1015
1016
pslld $30,%xmm7
1017
movdqa %xmm1,%xmm5
1018
por %xmm9,%xmm8
1019
psrld $31,%xmm5
1020
paddd %xmm6,%xmm14
1021
paddd %xmm1,%xmm1
1022
1023
psrld $2,%xmm11
1024
paddd %xmm8,%xmm14
1025
por %xmm5,%xmm1
1026
por %xmm7,%xmm11
1027
pxor %xmm4,%xmm2
1028
movdqa 32-128(%rax),%xmm4
1029
1030
movdqa %xmm14,%xmm8
1031
movdqa %xmm12,%xmm6
1032
pxor 128-128(%rax),%xmm2
1033
paddd %xmm15,%xmm13
1034
pslld $5,%xmm8
1035
pxor %xmm10,%xmm6
1036
1037
movdqa %xmm14,%xmm9
1038
movdqa %xmm1,240-128(%rax)
1039
paddd %xmm1,%xmm13
1040
pxor %xmm4,%xmm2
1041
psrld $27,%xmm9
1042
pxor %xmm11,%xmm6
1043
movdqa %xmm10,%xmm7
1044
1045
pslld $30,%xmm7
1046
movdqa %xmm2,%xmm5
1047
por %xmm9,%xmm8
1048
psrld $31,%xmm5
1049
paddd %xmm6,%xmm13
1050
paddd %xmm2,%xmm2
1051
1052
psrld $2,%xmm10
1053
paddd %xmm8,%xmm13
1054
por %xmm5,%xmm2
1055
por %xmm7,%xmm10
1056
pxor %xmm0,%xmm3
1057
movdqa 48-128(%rax),%xmm0
1058
1059
movdqa %xmm13,%xmm8
1060
movdqa %xmm11,%xmm6
1061
pxor 144-128(%rax),%xmm3
1062
paddd %xmm15,%xmm12
1063
pslld $5,%xmm8
1064
pxor %xmm14,%xmm6
1065
1066
movdqa %xmm13,%xmm9
1067
movdqa %xmm2,0-128(%rax)
1068
paddd %xmm2,%xmm12
1069
pxor %xmm0,%xmm3
1070
psrld $27,%xmm9
1071
pxor %xmm10,%xmm6
1072
movdqa %xmm14,%xmm7
1073
1074
pslld $30,%xmm7
1075
movdqa %xmm3,%xmm5
1076
por %xmm9,%xmm8
1077
psrld $31,%xmm5
1078
paddd %xmm6,%xmm12
1079
paddd %xmm3,%xmm3
1080
1081
psrld $2,%xmm14
1082
paddd %xmm8,%xmm12
1083
por %xmm5,%xmm3
1084
por %xmm7,%xmm14
1085
pxor %xmm1,%xmm4
1086
movdqa 64-128(%rax),%xmm1
1087
1088
movdqa %xmm12,%xmm8
1089
movdqa %xmm10,%xmm6
1090
pxor 160-128(%rax),%xmm4
1091
paddd %xmm15,%xmm11
1092
pslld $5,%xmm8
1093
pxor %xmm13,%xmm6
1094
1095
movdqa %xmm12,%xmm9
1096
movdqa %xmm3,16-128(%rax)
1097
paddd %xmm3,%xmm11
1098
pxor %xmm1,%xmm4
1099
psrld $27,%xmm9
1100
pxor %xmm14,%xmm6
1101
movdqa %xmm13,%xmm7
1102
1103
pslld $30,%xmm7
1104
movdqa %xmm4,%xmm5
1105
por %xmm9,%xmm8
1106
psrld $31,%xmm5
1107
paddd %xmm6,%xmm11
1108
paddd %xmm4,%xmm4
1109
1110
psrld $2,%xmm13
1111
paddd %xmm8,%xmm11
1112
por %xmm5,%xmm4
1113
por %xmm7,%xmm13
1114
pxor %xmm2,%xmm0
1115
movdqa 80-128(%rax),%xmm2
1116
1117
movdqa %xmm11,%xmm8
1118
movdqa %xmm14,%xmm6
1119
pxor 176-128(%rax),%xmm0
1120
paddd %xmm15,%xmm10
1121
pslld $5,%xmm8
1122
pxor %xmm12,%xmm6
1123
1124
movdqa %xmm11,%xmm9
1125
movdqa %xmm4,32-128(%rax)
1126
paddd %xmm4,%xmm10
1127
pxor %xmm2,%xmm0
1128
psrld $27,%xmm9
1129
pxor %xmm13,%xmm6
1130
movdqa %xmm12,%xmm7
1131
1132
pslld $30,%xmm7
1133
movdqa %xmm0,%xmm5
1134
por %xmm9,%xmm8
1135
psrld $31,%xmm5
1136
paddd %xmm6,%xmm10
1137
paddd %xmm0,%xmm0
1138
1139
psrld $2,%xmm12
1140
paddd %xmm8,%xmm10
1141
por %xmm5,%xmm0
1142
por %xmm7,%xmm12
1143
pxor %xmm3,%xmm1
1144
movdqa 96-128(%rax),%xmm3
1145
1146
movdqa %xmm10,%xmm8
1147
movdqa %xmm13,%xmm6
1148
pxor 192-128(%rax),%xmm1
1149
paddd %xmm15,%xmm14
1150
pslld $5,%xmm8
1151
pxor %xmm11,%xmm6
1152
1153
movdqa %xmm10,%xmm9
1154
movdqa %xmm0,48-128(%rax)
1155
paddd %xmm0,%xmm14
1156
pxor %xmm3,%xmm1
1157
psrld $27,%xmm9
1158
pxor %xmm12,%xmm6
1159
movdqa %xmm11,%xmm7
1160
1161
pslld $30,%xmm7
1162
movdqa %xmm1,%xmm5
1163
por %xmm9,%xmm8
1164
psrld $31,%xmm5
1165
paddd %xmm6,%xmm14
1166
paddd %xmm1,%xmm1
1167
1168
psrld $2,%xmm11
1169
paddd %xmm8,%xmm14
1170
por %xmm5,%xmm1
1171
por %xmm7,%xmm11
1172
pxor %xmm4,%xmm2
1173
movdqa 112-128(%rax),%xmm4
1174
1175
movdqa %xmm14,%xmm8
1176
movdqa %xmm12,%xmm6
1177
pxor 208-128(%rax),%xmm2
1178
paddd %xmm15,%xmm13
1179
pslld $5,%xmm8
1180
pxor %xmm10,%xmm6
1181
1182
movdqa %xmm14,%xmm9
1183
movdqa %xmm1,64-128(%rax)
1184
paddd %xmm1,%xmm13
1185
pxor %xmm4,%xmm2
1186
psrld $27,%xmm9
1187
pxor %xmm11,%xmm6
1188
movdqa %xmm10,%xmm7
1189
1190
pslld $30,%xmm7
1191
movdqa %xmm2,%xmm5
1192
por %xmm9,%xmm8
1193
psrld $31,%xmm5
1194
paddd %xmm6,%xmm13
1195
paddd %xmm2,%xmm2
1196
1197
psrld $2,%xmm10
1198
paddd %xmm8,%xmm13
1199
por %xmm5,%xmm2
1200
por %xmm7,%xmm10
1201
pxor %xmm0,%xmm3
1202
movdqa 128-128(%rax),%xmm0
1203
1204
movdqa %xmm13,%xmm8
1205
movdqa %xmm11,%xmm6
1206
pxor 224-128(%rax),%xmm3
1207
paddd %xmm15,%xmm12
1208
pslld $5,%xmm8
1209
pxor %xmm14,%xmm6
1210
1211
movdqa %xmm13,%xmm9
1212
movdqa %xmm2,80-128(%rax)
1213
paddd %xmm2,%xmm12
1214
pxor %xmm0,%xmm3
1215
psrld $27,%xmm9
1216
pxor %xmm10,%xmm6
1217
movdqa %xmm14,%xmm7
1218
1219
pslld $30,%xmm7
1220
movdqa %xmm3,%xmm5
1221
por %xmm9,%xmm8
1222
psrld $31,%xmm5
1223
paddd %xmm6,%xmm12
1224
paddd %xmm3,%xmm3
1225
1226
psrld $2,%xmm14
1227
paddd %xmm8,%xmm12
1228
por %xmm5,%xmm3
1229
por %xmm7,%xmm14
1230
pxor %xmm1,%xmm4
1231
movdqa 144-128(%rax),%xmm1
1232
1233
movdqa %xmm12,%xmm8
1234
movdqa %xmm10,%xmm6
1235
pxor 240-128(%rax),%xmm4
1236
paddd %xmm15,%xmm11
1237
pslld $5,%xmm8
1238
pxor %xmm13,%xmm6
1239
1240
movdqa %xmm12,%xmm9
1241
movdqa %xmm3,96-128(%rax)
1242
paddd %xmm3,%xmm11
1243
pxor %xmm1,%xmm4
1244
psrld $27,%xmm9
1245
pxor %xmm14,%xmm6
1246
movdqa %xmm13,%xmm7
1247
1248
pslld $30,%xmm7
1249
movdqa %xmm4,%xmm5
1250
por %xmm9,%xmm8
1251
psrld $31,%xmm5
1252
paddd %xmm6,%xmm11
1253
paddd %xmm4,%xmm4
1254
1255
psrld $2,%xmm13
1256
paddd %xmm8,%xmm11
1257
por %xmm5,%xmm4
1258
por %xmm7,%xmm13
1259
pxor %xmm2,%xmm0
1260
movdqa 160-128(%rax),%xmm2
1261
1262
movdqa %xmm11,%xmm8
1263
movdqa %xmm14,%xmm6
1264
pxor 0-128(%rax),%xmm0
1265
paddd %xmm15,%xmm10
1266
pslld $5,%xmm8
1267
pxor %xmm12,%xmm6
1268
1269
movdqa %xmm11,%xmm9
1270
movdqa %xmm4,112-128(%rax)
1271
paddd %xmm4,%xmm10
1272
pxor %xmm2,%xmm0
1273
psrld $27,%xmm9
1274
pxor %xmm13,%xmm6
1275
movdqa %xmm12,%xmm7
1276
1277
pslld $30,%xmm7
1278
movdqa %xmm0,%xmm5
1279
por %xmm9,%xmm8
1280
psrld $31,%xmm5
1281
paddd %xmm6,%xmm10
1282
paddd %xmm0,%xmm0
1283
1284
psrld $2,%xmm12
1285
paddd %xmm8,%xmm10
1286
por %xmm5,%xmm0
1287
por %xmm7,%xmm12
1288
movdqa 32(%rbp),%xmm15
1289
pxor %xmm3,%xmm1
1290
movdqa 176-128(%rax),%xmm3
1291
1292
movdqa %xmm10,%xmm8
1293
movdqa %xmm13,%xmm7
1294
pxor 16-128(%rax),%xmm1
1295
pxor %xmm3,%xmm1
1296
paddd %xmm15,%xmm14
1297
pslld $5,%xmm8
1298
movdqa %xmm10,%xmm9
1299
pand %xmm12,%xmm7
1300
1301
movdqa %xmm13,%xmm6
1302
movdqa %xmm1,%xmm5
1303
psrld $27,%xmm9
1304
paddd %xmm7,%xmm14
1305
pxor %xmm12,%xmm6
1306
1307
movdqa %xmm0,128-128(%rax)
1308
paddd %xmm0,%xmm14
1309
por %xmm9,%xmm8
1310
psrld $31,%xmm5
1311
pand %xmm11,%xmm6
1312
movdqa %xmm11,%xmm7
1313
1314
pslld $30,%xmm7
1315
paddd %xmm1,%xmm1
1316
paddd %xmm6,%xmm14
1317
1318
psrld $2,%xmm11
1319
paddd %xmm8,%xmm14
1320
por %xmm5,%xmm1
1321
por %xmm7,%xmm11
1322
pxor %xmm4,%xmm2
1323
movdqa 192-128(%rax),%xmm4
1324
1325
movdqa %xmm14,%xmm8
1326
movdqa %xmm12,%xmm7
1327
pxor 32-128(%rax),%xmm2
1328
pxor %xmm4,%xmm2
1329
paddd %xmm15,%xmm13
1330
pslld $5,%xmm8
1331
movdqa %xmm14,%xmm9
1332
pand %xmm11,%xmm7
1333
1334
movdqa %xmm12,%xmm6
1335
movdqa %xmm2,%xmm5
1336
psrld $27,%xmm9
1337
paddd %xmm7,%xmm13
1338
pxor %xmm11,%xmm6
1339
1340
movdqa %xmm1,144-128(%rax)
1341
paddd %xmm1,%xmm13
1342
por %xmm9,%xmm8
1343
psrld $31,%xmm5
1344
pand %xmm10,%xmm6
1345
movdqa %xmm10,%xmm7
1346
1347
pslld $30,%xmm7
1348
paddd %xmm2,%xmm2
1349
paddd %xmm6,%xmm13
1350
1351
psrld $2,%xmm10
1352
paddd %xmm8,%xmm13
1353
por %xmm5,%xmm2
1354
por %xmm7,%xmm10
1355
pxor %xmm0,%xmm3
1356
movdqa 208-128(%rax),%xmm0
1357
1358
movdqa %xmm13,%xmm8
1359
movdqa %xmm11,%xmm7
1360
pxor 48-128(%rax),%xmm3
1361
pxor %xmm0,%xmm3
1362
paddd %xmm15,%xmm12
1363
pslld $5,%xmm8
1364
movdqa %xmm13,%xmm9
1365
pand %xmm10,%xmm7
1366
1367
movdqa %xmm11,%xmm6
1368
movdqa %xmm3,%xmm5
1369
psrld $27,%xmm9
1370
paddd %xmm7,%xmm12
1371
pxor %xmm10,%xmm6
1372
1373
movdqa %xmm2,160-128(%rax)
1374
paddd %xmm2,%xmm12
1375
por %xmm9,%xmm8
1376
psrld $31,%xmm5
1377
pand %xmm14,%xmm6
1378
movdqa %xmm14,%xmm7
1379
1380
pslld $30,%xmm7
1381
paddd %xmm3,%xmm3
1382
paddd %xmm6,%xmm12
1383
1384
psrld $2,%xmm14
1385
paddd %xmm8,%xmm12
1386
por %xmm5,%xmm3
1387
por %xmm7,%xmm14
1388
pxor %xmm1,%xmm4
1389
movdqa 224-128(%rax),%xmm1
1390
1391
movdqa %xmm12,%xmm8
1392
movdqa %xmm10,%xmm7
1393
pxor 64-128(%rax),%xmm4
1394
pxor %xmm1,%xmm4
1395
paddd %xmm15,%xmm11
1396
pslld $5,%xmm8
1397
movdqa %xmm12,%xmm9
1398
pand %xmm14,%xmm7
1399
1400
movdqa %xmm10,%xmm6
1401
movdqa %xmm4,%xmm5
1402
psrld $27,%xmm9
1403
paddd %xmm7,%xmm11
1404
pxor %xmm14,%xmm6
1405
1406
movdqa %xmm3,176-128(%rax)
1407
paddd %xmm3,%xmm11
1408
por %xmm9,%xmm8
1409
psrld $31,%xmm5
1410
pand %xmm13,%xmm6
1411
movdqa %xmm13,%xmm7
1412
1413
pslld $30,%xmm7
1414
paddd %xmm4,%xmm4
1415
paddd %xmm6,%xmm11
1416
1417
psrld $2,%xmm13
1418
paddd %xmm8,%xmm11
1419
por %xmm5,%xmm4
1420
por %xmm7,%xmm13
1421
pxor %xmm2,%xmm0
1422
movdqa 240-128(%rax),%xmm2
1423
1424
movdqa %xmm11,%xmm8
1425
movdqa %xmm14,%xmm7
1426
pxor 80-128(%rax),%xmm0
1427
pxor %xmm2,%xmm0
1428
paddd %xmm15,%xmm10
1429
pslld $5,%xmm8
1430
movdqa %xmm11,%xmm9
1431
pand %xmm13,%xmm7
1432
1433
movdqa %xmm14,%xmm6
1434
movdqa %xmm0,%xmm5
1435
psrld $27,%xmm9
1436
paddd %xmm7,%xmm10
1437
pxor %xmm13,%xmm6
1438
1439
movdqa %xmm4,192-128(%rax)
1440
paddd %xmm4,%xmm10
1441
por %xmm9,%xmm8
1442
psrld $31,%xmm5
1443
pand %xmm12,%xmm6
1444
movdqa %xmm12,%xmm7
1445
1446
pslld $30,%xmm7
1447
paddd %xmm0,%xmm0
1448
paddd %xmm6,%xmm10
1449
1450
psrld $2,%xmm12
1451
paddd %xmm8,%xmm10
1452
por %xmm5,%xmm0
1453
por %xmm7,%xmm12
1454
pxor %xmm3,%xmm1
1455
movdqa 0-128(%rax),%xmm3
1456
1457
movdqa %xmm10,%xmm8
1458
movdqa %xmm13,%xmm7
1459
pxor 96-128(%rax),%xmm1
1460
pxor %xmm3,%xmm1
1461
paddd %xmm15,%xmm14
1462
pslld $5,%xmm8
1463
movdqa %xmm10,%xmm9
1464
pand %xmm12,%xmm7
1465
1466
movdqa %xmm13,%xmm6
1467
movdqa %xmm1,%xmm5
1468
psrld $27,%xmm9
1469
paddd %xmm7,%xmm14
1470
pxor %xmm12,%xmm6
1471
1472
movdqa %xmm0,208-128(%rax)
1473
paddd %xmm0,%xmm14
1474
por %xmm9,%xmm8
1475
psrld $31,%xmm5
1476
pand %xmm11,%xmm6
1477
movdqa %xmm11,%xmm7
1478
1479
pslld $30,%xmm7
1480
paddd %xmm1,%xmm1
1481
paddd %xmm6,%xmm14
1482
1483
psrld $2,%xmm11
1484
paddd %xmm8,%xmm14
1485
por %xmm5,%xmm1
1486
por %xmm7,%xmm11
1487
pxor %xmm4,%xmm2
1488
movdqa 16-128(%rax),%xmm4
1489
1490
movdqa %xmm14,%xmm8
1491
movdqa %xmm12,%xmm7
1492
pxor 112-128(%rax),%xmm2
1493
pxor %xmm4,%xmm2
1494
paddd %xmm15,%xmm13
1495
pslld $5,%xmm8
1496
movdqa %xmm14,%xmm9
1497
pand %xmm11,%xmm7
1498
1499
movdqa %xmm12,%xmm6
1500
movdqa %xmm2,%xmm5
1501
psrld $27,%xmm9
1502
paddd %xmm7,%xmm13
1503
pxor %xmm11,%xmm6
1504
1505
movdqa %xmm1,224-128(%rax)
1506
paddd %xmm1,%xmm13
1507
por %xmm9,%xmm8
1508
psrld $31,%xmm5
1509
pand %xmm10,%xmm6
1510
movdqa %xmm10,%xmm7
1511
1512
pslld $30,%xmm7
1513
paddd %xmm2,%xmm2
1514
paddd %xmm6,%xmm13
1515
1516
psrld $2,%xmm10
1517
paddd %xmm8,%xmm13
1518
por %xmm5,%xmm2
1519
por %xmm7,%xmm10
1520
pxor %xmm0,%xmm3
1521
movdqa 32-128(%rax),%xmm0
1522
1523
movdqa %xmm13,%xmm8
1524
movdqa %xmm11,%xmm7
1525
pxor 128-128(%rax),%xmm3
1526
pxor %xmm0,%xmm3
1527
paddd %xmm15,%xmm12
1528
pslld $5,%xmm8
1529
movdqa %xmm13,%xmm9
1530
pand %xmm10,%xmm7
1531
1532
movdqa %xmm11,%xmm6
1533
movdqa %xmm3,%xmm5
1534
psrld $27,%xmm9
1535
paddd %xmm7,%xmm12
1536
pxor %xmm10,%xmm6
1537
1538
movdqa %xmm2,240-128(%rax)
1539
paddd %xmm2,%xmm12
1540
por %xmm9,%xmm8
1541
psrld $31,%xmm5
1542
pand %xmm14,%xmm6
1543
movdqa %xmm14,%xmm7
1544
1545
pslld $30,%xmm7
1546
paddd %xmm3,%xmm3
1547
paddd %xmm6,%xmm12
1548
1549
psrld $2,%xmm14
1550
paddd %xmm8,%xmm12
1551
por %xmm5,%xmm3
1552
por %xmm7,%xmm14
1553
pxor %xmm1,%xmm4
1554
movdqa 48-128(%rax),%xmm1
1555
1556
movdqa %xmm12,%xmm8
1557
movdqa %xmm10,%xmm7
1558
pxor 144-128(%rax),%xmm4
1559
pxor %xmm1,%xmm4
1560
paddd %xmm15,%xmm11
1561
pslld $5,%xmm8
1562
movdqa %xmm12,%xmm9
1563
pand %xmm14,%xmm7
1564
1565
movdqa %xmm10,%xmm6
1566
movdqa %xmm4,%xmm5
1567
psrld $27,%xmm9
1568
paddd %xmm7,%xmm11
1569
pxor %xmm14,%xmm6
1570
1571
movdqa %xmm3,0-128(%rax)
1572
paddd %xmm3,%xmm11
1573
por %xmm9,%xmm8
1574
psrld $31,%xmm5
1575
pand %xmm13,%xmm6
1576
movdqa %xmm13,%xmm7
1577
1578
pslld $30,%xmm7
1579
paddd %xmm4,%xmm4
1580
paddd %xmm6,%xmm11
1581
1582
psrld $2,%xmm13
1583
paddd %xmm8,%xmm11
1584
por %xmm5,%xmm4
1585
por %xmm7,%xmm13
1586
pxor %xmm2,%xmm0
1587
movdqa 64-128(%rax),%xmm2
1588
1589
movdqa %xmm11,%xmm8
1590
movdqa %xmm14,%xmm7
1591
pxor 160-128(%rax),%xmm0
1592
pxor %xmm2,%xmm0
1593
paddd %xmm15,%xmm10
1594
pslld $5,%xmm8
1595
movdqa %xmm11,%xmm9
1596
pand %xmm13,%xmm7
1597
1598
movdqa %xmm14,%xmm6
1599
movdqa %xmm0,%xmm5
1600
psrld $27,%xmm9
1601
paddd %xmm7,%xmm10
1602
pxor %xmm13,%xmm6
1603
1604
movdqa %xmm4,16-128(%rax)
1605
paddd %xmm4,%xmm10
1606
por %xmm9,%xmm8
1607
psrld $31,%xmm5
1608
pand %xmm12,%xmm6
1609
movdqa %xmm12,%xmm7
1610
1611
pslld $30,%xmm7
1612
paddd %xmm0,%xmm0
1613
paddd %xmm6,%xmm10
1614
1615
psrld $2,%xmm12
1616
paddd %xmm8,%xmm10
1617
por %xmm5,%xmm0
1618
por %xmm7,%xmm12
1619
pxor %xmm3,%xmm1
1620
movdqa 80-128(%rax),%xmm3
1621
1622
movdqa %xmm10,%xmm8
1623
movdqa %xmm13,%xmm7
1624
pxor 176-128(%rax),%xmm1
1625
pxor %xmm3,%xmm1
1626
paddd %xmm15,%xmm14
1627
pslld $5,%xmm8
1628
movdqa %xmm10,%xmm9
1629
pand %xmm12,%xmm7
1630
1631
movdqa %xmm13,%xmm6
1632
movdqa %xmm1,%xmm5
1633
psrld $27,%xmm9
1634
paddd %xmm7,%xmm14
1635
pxor %xmm12,%xmm6
1636
1637
movdqa %xmm0,32-128(%rax)
1638
paddd %xmm0,%xmm14
1639
por %xmm9,%xmm8
1640
psrld $31,%xmm5
1641
pand %xmm11,%xmm6
1642
movdqa %xmm11,%xmm7
1643
1644
pslld $30,%xmm7
1645
paddd %xmm1,%xmm1
1646
paddd %xmm6,%xmm14
1647
1648
psrld $2,%xmm11
1649
paddd %xmm8,%xmm14
1650
por %xmm5,%xmm1
1651
por %xmm7,%xmm11
1652
pxor %xmm4,%xmm2
1653
movdqa 96-128(%rax),%xmm4
1654
1655
movdqa %xmm14,%xmm8
1656
movdqa %xmm12,%xmm7
1657
pxor 192-128(%rax),%xmm2
1658
pxor %xmm4,%xmm2
1659
paddd %xmm15,%xmm13
1660
pslld $5,%xmm8
1661
movdqa %xmm14,%xmm9
1662
pand %xmm11,%xmm7
1663
1664
movdqa %xmm12,%xmm6
1665
movdqa %xmm2,%xmm5
1666
psrld $27,%xmm9
1667
paddd %xmm7,%xmm13
1668
pxor %xmm11,%xmm6
1669
1670
movdqa %xmm1,48-128(%rax)
1671
paddd %xmm1,%xmm13
1672
por %xmm9,%xmm8
1673
psrld $31,%xmm5
1674
pand %xmm10,%xmm6
1675
movdqa %xmm10,%xmm7
1676
1677
pslld $30,%xmm7
1678
paddd %xmm2,%xmm2
1679
paddd %xmm6,%xmm13
1680
1681
psrld $2,%xmm10
1682
paddd %xmm8,%xmm13
1683
por %xmm5,%xmm2
1684
por %xmm7,%xmm10
1685
pxor %xmm0,%xmm3
1686
movdqa 112-128(%rax),%xmm0
1687
1688
movdqa %xmm13,%xmm8
1689
movdqa %xmm11,%xmm7
1690
pxor 208-128(%rax),%xmm3
1691
pxor %xmm0,%xmm3
1692
paddd %xmm15,%xmm12
1693
pslld $5,%xmm8
1694
movdqa %xmm13,%xmm9
1695
pand %xmm10,%xmm7
1696
1697
movdqa %xmm11,%xmm6
1698
movdqa %xmm3,%xmm5
1699
psrld $27,%xmm9
1700
paddd %xmm7,%xmm12
1701
pxor %xmm10,%xmm6
1702
1703
movdqa %xmm2,64-128(%rax)
1704
paddd %xmm2,%xmm12
1705
por %xmm9,%xmm8
1706
psrld $31,%xmm5
1707
pand %xmm14,%xmm6
1708
movdqa %xmm14,%xmm7
1709
1710
pslld $30,%xmm7
1711
paddd %xmm3,%xmm3
1712
paddd %xmm6,%xmm12
1713
1714
psrld $2,%xmm14
1715
paddd %xmm8,%xmm12
1716
por %xmm5,%xmm3
1717
por %xmm7,%xmm14
1718
pxor %xmm1,%xmm4
1719
movdqa 128-128(%rax),%xmm1
1720
1721
movdqa %xmm12,%xmm8
1722
movdqa %xmm10,%xmm7
1723
pxor 224-128(%rax),%xmm4
1724
pxor %xmm1,%xmm4
1725
paddd %xmm15,%xmm11
1726
pslld $5,%xmm8
1727
movdqa %xmm12,%xmm9
1728
pand %xmm14,%xmm7
1729
1730
movdqa %xmm10,%xmm6
1731
movdqa %xmm4,%xmm5
1732
psrld $27,%xmm9
1733
paddd %xmm7,%xmm11
1734
pxor %xmm14,%xmm6
1735
1736
movdqa %xmm3,80-128(%rax)
1737
paddd %xmm3,%xmm11
1738
por %xmm9,%xmm8
1739
psrld $31,%xmm5
1740
pand %xmm13,%xmm6
1741
movdqa %xmm13,%xmm7
1742
1743
pslld $30,%xmm7
1744
paddd %xmm4,%xmm4
1745
paddd %xmm6,%xmm11
1746
1747
psrld $2,%xmm13
1748
paddd %xmm8,%xmm11
1749
por %xmm5,%xmm4
1750
por %xmm7,%xmm13
1751
pxor %xmm2,%xmm0
1752
movdqa 144-128(%rax),%xmm2
1753
1754
movdqa %xmm11,%xmm8
1755
movdqa %xmm14,%xmm7
1756
pxor 240-128(%rax),%xmm0
1757
pxor %xmm2,%xmm0
1758
paddd %xmm15,%xmm10
1759
pslld $5,%xmm8
1760
movdqa %xmm11,%xmm9
1761
pand %xmm13,%xmm7
1762
1763
movdqa %xmm14,%xmm6
1764
movdqa %xmm0,%xmm5
1765
psrld $27,%xmm9
1766
paddd %xmm7,%xmm10
1767
pxor %xmm13,%xmm6
1768
1769
movdqa %xmm4,96-128(%rax)
1770
paddd %xmm4,%xmm10
1771
por %xmm9,%xmm8
1772
psrld $31,%xmm5
1773
pand %xmm12,%xmm6
1774
movdqa %xmm12,%xmm7
1775
1776
pslld $30,%xmm7
1777
paddd %xmm0,%xmm0
1778
paddd %xmm6,%xmm10
1779
1780
psrld $2,%xmm12
1781
paddd %xmm8,%xmm10
1782
por %xmm5,%xmm0
1783
por %xmm7,%xmm12
1784
pxor %xmm3,%xmm1
1785
movdqa 160-128(%rax),%xmm3
1786
1787
movdqa %xmm10,%xmm8
1788
movdqa %xmm13,%xmm7
1789
pxor 0-128(%rax),%xmm1
1790
pxor %xmm3,%xmm1
1791
paddd %xmm15,%xmm14
1792
pslld $5,%xmm8
1793
movdqa %xmm10,%xmm9
1794
pand %xmm12,%xmm7
1795
1796
movdqa %xmm13,%xmm6
1797
movdqa %xmm1,%xmm5
1798
psrld $27,%xmm9
1799
paddd %xmm7,%xmm14
1800
pxor %xmm12,%xmm6
1801
1802
movdqa %xmm0,112-128(%rax)
1803
paddd %xmm0,%xmm14
1804
por %xmm9,%xmm8
1805
psrld $31,%xmm5
1806
pand %xmm11,%xmm6
1807
movdqa %xmm11,%xmm7
1808
1809
pslld $30,%xmm7
1810
paddd %xmm1,%xmm1
1811
paddd %xmm6,%xmm14
1812
1813
psrld $2,%xmm11
1814
paddd %xmm8,%xmm14
1815
por %xmm5,%xmm1
1816
por %xmm7,%xmm11
1817
pxor %xmm4,%xmm2
1818
movdqa 176-128(%rax),%xmm4
1819
1820
movdqa %xmm14,%xmm8
1821
movdqa %xmm12,%xmm7
1822
pxor 16-128(%rax),%xmm2
1823
pxor %xmm4,%xmm2
1824
paddd %xmm15,%xmm13
1825
pslld $5,%xmm8
1826
movdqa %xmm14,%xmm9
1827
pand %xmm11,%xmm7
1828
1829
movdqa %xmm12,%xmm6
1830
movdqa %xmm2,%xmm5
1831
psrld $27,%xmm9
1832
paddd %xmm7,%xmm13
1833
pxor %xmm11,%xmm6
1834
1835
movdqa %xmm1,128-128(%rax)
1836
paddd %xmm1,%xmm13
1837
por %xmm9,%xmm8
1838
psrld $31,%xmm5
1839
pand %xmm10,%xmm6
1840
movdqa %xmm10,%xmm7
1841
1842
pslld $30,%xmm7
1843
paddd %xmm2,%xmm2
1844
paddd %xmm6,%xmm13
1845
1846
psrld $2,%xmm10
1847
paddd %xmm8,%xmm13
1848
por %xmm5,%xmm2
1849
por %xmm7,%xmm10
1850
pxor %xmm0,%xmm3
1851
movdqa 192-128(%rax),%xmm0
1852
1853
movdqa %xmm13,%xmm8
1854
movdqa %xmm11,%xmm7
1855
pxor 32-128(%rax),%xmm3
1856
pxor %xmm0,%xmm3
1857
paddd %xmm15,%xmm12
1858
pslld $5,%xmm8
1859
movdqa %xmm13,%xmm9
1860
pand %xmm10,%xmm7
1861
1862
movdqa %xmm11,%xmm6
1863
movdqa %xmm3,%xmm5
1864
psrld $27,%xmm9
1865
paddd %xmm7,%xmm12
1866
pxor %xmm10,%xmm6
1867
1868
movdqa %xmm2,144-128(%rax)
1869
paddd %xmm2,%xmm12
1870
por %xmm9,%xmm8
1871
psrld $31,%xmm5
1872
pand %xmm14,%xmm6
1873
movdqa %xmm14,%xmm7
1874
1875
pslld $30,%xmm7
1876
paddd %xmm3,%xmm3
1877
paddd %xmm6,%xmm12
1878
1879
psrld $2,%xmm14
1880
paddd %xmm8,%xmm12
1881
por %xmm5,%xmm3
1882
por %xmm7,%xmm14
1883
pxor %xmm1,%xmm4
1884
movdqa 208-128(%rax),%xmm1
1885
1886
movdqa %xmm12,%xmm8
1887
movdqa %xmm10,%xmm7
1888
pxor 48-128(%rax),%xmm4
1889
pxor %xmm1,%xmm4
1890
paddd %xmm15,%xmm11
1891
pslld $5,%xmm8
1892
movdqa %xmm12,%xmm9
1893
pand %xmm14,%xmm7
1894
1895
movdqa %xmm10,%xmm6
1896
movdqa %xmm4,%xmm5
1897
psrld $27,%xmm9
1898
paddd %xmm7,%xmm11
1899
pxor %xmm14,%xmm6
1900
1901
movdqa %xmm3,160-128(%rax)
1902
paddd %xmm3,%xmm11
1903
por %xmm9,%xmm8
1904
psrld $31,%xmm5
1905
pand %xmm13,%xmm6
1906
movdqa %xmm13,%xmm7
1907
1908
pslld $30,%xmm7
1909
paddd %xmm4,%xmm4
1910
paddd %xmm6,%xmm11
1911
1912
psrld $2,%xmm13
1913
paddd %xmm8,%xmm11
1914
por %xmm5,%xmm4
1915
por %xmm7,%xmm13
1916
pxor %xmm2,%xmm0
1917
movdqa 224-128(%rax),%xmm2
1918
1919
movdqa %xmm11,%xmm8
1920
movdqa %xmm14,%xmm7
1921
pxor 64-128(%rax),%xmm0
1922
pxor %xmm2,%xmm0
1923
paddd %xmm15,%xmm10
1924
pslld $5,%xmm8
1925
movdqa %xmm11,%xmm9
1926
pand %xmm13,%xmm7
1927
1928
movdqa %xmm14,%xmm6
1929
movdqa %xmm0,%xmm5
1930
psrld $27,%xmm9
1931
paddd %xmm7,%xmm10
1932
pxor %xmm13,%xmm6
1933
1934
movdqa %xmm4,176-128(%rax)
1935
paddd %xmm4,%xmm10
1936
por %xmm9,%xmm8
1937
psrld $31,%xmm5
1938
pand %xmm12,%xmm6
1939
movdqa %xmm12,%xmm7
1940
1941
pslld $30,%xmm7
1942
paddd %xmm0,%xmm0
1943
paddd %xmm6,%xmm10
1944
1945
psrld $2,%xmm12
1946
paddd %xmm8,%xmm10
1947
por %xmm5,%xmm0
1948
por %xmm7,%xmm12
1949
movdqa 64(%rbp),%xmm15
1950
pxor %xmm3,%xmm1
1951
movdqa 240-128(%rax),%xmm3
1952
1953
movdqa %xmm10,%xmm8
1954
movdqa %xmm13,%xmm6
1955
pxor 80-128(%rax),%xmm1
1956
paddd %xmm15,%xmm14
1957
pslld $5,%xmm8
1958
pxor %xmm11,%xmm6
1959
1960
movdqa %xmm10,%xmm9
1961
movdqa %xmm0,192-128(%rax)
1962
paddd %xmm0,%xmm14
1963
pxor %xmm3,%xmm1
1964
psrld $27,%xmm9
1965
pxor %xmm12,%xmm6
1966
movdqa %xmm11,%xmm7
1967
1968
pslld $30,%xmm7
1969
movdqa %xmm1,%xmm5
1970
por %xmm9,%xmm8
1971
psrld $31,%xmm5
1972
paddd %xmm6,%xmm14
1973
paddd %xmm1,%xmm1
1974
1975
psrld $2,%xmm11
1976
paddd %xmm8,%xmm14
1977
por %xmm5,%xmm1
1978
por %xmm7,%xmm11
1979
pxor %xmm4,%xmm2
1980
movdqa 0-128(%rax),%xmm4
1981
1982
movdqa %xmm14,%xmm8
1983
movdqa %xmm12,%xmm6
1984
pxor 96-128(%rax),%xmm2
1985
paddd %xmm15,%xmm13
1986
pslld $5,%xmm8
1987
pxor %xmm10,%xmm6
1988
1989
movdqa %xmm14,%xmm9
1990
movdqa %xmm1,208-128(%rax)
1991
paddd %xmm1,%xmm13
1992
pxor %xmm4,%xmm2
1993
psrld $27,%xmm9
1994
pxor %xmm11,%xmm6
1995
movdqa %xmm10,%xmm7
1996
1997
pslld $30,%xmm7
1998
movdqa %xmm2,%xmm5
1999
por %xmm9,%xmm8
2000
psrld $31,%xmm5
2001
paddd %xmm6,%xmm13
2002
paddd %xmm2,%xmm2
2003
2004
psrld $2,%xmm10
2005
paddd %xmm8,%xmm13
2006
por %xmm5,%xmm2
2007
por %xmm7,%xmm10
2008
pxor %xmm0,%xmm3
2009
movdqa 16-128(%rax),%xmm0
2010
2011
movdqa %xmm13,%xmm8
2012
movdqa %xmm11,%xmm6
2013
pxor 112-128(%rax),%xmm3
2014
paddd %xmm15,%xmm12
2015
pslld $5,%xmm8
2016
pxor %xmm14,%xmm6
2017
2018
movdqa %xmm13,%xmm9
2019
movdqa %xmm2,224-128(%rax)
2020
paddd %xmm2,%xmm12
2021
pxor %xmm0,%xmm3
2022
psrld $27,%xmm9
2023
pxor %xmm10,%xmm6
2024
movdqa %xmm14,%xmm7
2025
2026
pslld $30,%xmm7
2027
movdqa %xmm3,%xmm5
2028
por %xmm9,%xmm8
2029
psrld $31,%xmm5
2030
paddd %xmm6,%xmm12
2031
paddd %xmm3,%xmm3
2032
2033
psrld $2,%xmm14
2034
paddd %xmm8,%xmm12
2035
por %xmm5,%xmm3
2036
por %xmm7,%xmm14
2037
pxor %xmm1,%xmm4
2038
movdqa 32-128(%rax),%xmm1
2039
2040
movdqa %xmm12,%xmm8
2041
movdqa %xmm10,%xmm6
2042
pxor 128-128(%rax),%xmm4
2043
paddd %xmm15,%xmm11
2044
pslld $5,%xmm8
2045
pxor %xmm13,%xmm6
2046
2047
movdqa %xmm12,%xmm9
2048
movdqa %xmm3,240-128(%rax)
2049
paddd %xmm3,%xmm11
2050
pxor %xmm1,%xmm4
2051
psrld $27,%xmm9
2052
pxor %xmm14,%xmm6
2053
movdqa %xmm13,%xmm7
2054
2055
pslld $30,%xmm7
2056
movdqa %xmm4,%xmm5
2057
por %xmm9,%xmm8
2058
psrld $31,%xmm5
2059
paddd %xmm6,%xmm11
2060
paddd %xmm4,%xmm4
2061
2062
psrld $2,%xmm13
2063
paddd %xmm8,%xmm11
2064
por %xmm5,%xmm4
2065
por %xmm7,%xmm13
2066
pxor %xmm2,%xmm0
2067
movdqa 48-128(%rax),%xmm2
2068
2069
movdqa %xmm11,%xmm8
2070
movdqa %xmm14,%xmm6
2071
pxor 144-128(%rax),%xmm0
2072
paddd %xmm15,%xmm10
2073
pslld $5,%xmm8
2074
pxor %xmm12,%xmm6
2075
2076
movdqa %xmm11,%xmm9
2077
movdqa %xmm4,0-128(%rax)
2078
paddd %xmm4,%xmm10
2079
pxor %xmm2,%xmm0
2080
psrld $27,%xmm9
2081
pxor %xmm13,%xmm6
2082
movdqa %xmm12,%xmm7
2083
2084
pslld $30,%xmm7
2085
movdqa %xmm0,%xmm5
2086
por %xmm9,%xmm8
2087
psrld $31,%xmm5
2088
paddd %xmm6,%xmm10
2089
paddd %xmm0,%xmm0
2090
2091
psrld $2,%xmm12
2092
paddd %xmm8,%xmm10
2093
por %xmm5,%xmm0
2094
por %xmm7,%xmm12
2095
pxor %xmm3,%xmm1
2096
movdqa 64-128(%rax),%xmm3
2097
2098
movdqa %xmm10,%xmm8
2099
movdqa %xmm13,%xmm6
2100
pxor 160-128(%rax),%xmm1
2101
paddd %xmm15,%xmm14
2102
pslld $5,%xmm8
2103
pxor %xmm11,%xmm6
2104
2105
movdqa %xmm10,%xmm9
2106
movdqa %xmm0,16-128(%rax)
2107
paddd %xmm0,%xmm14
2108
pxor %xmm3,%xmm1
2109
psrld $27,%xmm9
2110
pxor %xmm12,%xmm6
2111
movdqa %xmm11,%xmm7
2112
2113
pslld $30,%xmm7
2114
movdqa %xmm1,%xmm5
2115
por %xmm9,%xmm8
2116
psrld $31,%xmm5
2117
paddd %xmm6,%xmm14
2118
paddd %xmm1,%xmm1
2119
2120
psrld $2,%xmm11
2121
paddd %xmm8,%xmm14
2122
por %xmm5,%xmm1
2123
por %xmm7,%xmm11
2124
pxor %xmm4,%xmm2
2125
movdqa 80-128(%rax),%xmm4
2126
2127
movdqa %xmm14,%xmm8
2128
movdqa %xmm12,%xmm6
2129
pxor 176-128(%rax),%xmm2
2130
paddd %xmm15,%xmm13
2131
pslld $5,%xmm8
2132
pxor %xmm10,%xmm6
2133
2134
movdqa %xmm14,%xmm9
2135
movdqa %xmm1,32-128(%rax)
2136
paddd %xmm1,%xmm13
2137
pxor %xmm4,%xmm2
2138
psrld $27,%xmm9
2139
pxor %xmm11,%xmm6
2140
movdqa %xmm10,%xmm7
2141
2142
pslld $30,%xmm7
2143
movdqa %xmm2,%xmm5
2144
por %xmm9,%xmm8
2145
psrld $31,%xmm5
2146
paddd %xmm6,%xmm13
2147
paddd %xmm2,%xmm2
2148
2149
psrld $2,%xmm10
2150
paddd %xmm8,%xmm13
2151
por %xmm5,%xmm2
2152
por %xmm7,%xmm10
2153
pxor %xmm0,%xmm3
2154
movdqa 96-128(%rax),%xmm0
2155
2156
movdqa %xmm13,%xmm8
2157
movdqa %xmm11,%xmm6
2158
pxor 192-128(%rax),%xmm3
2159
paddd %xmm15,%xmm12
2160
pslld $5,%xmm8
2161
pxor %xmm14,%xmm6
2162
2163
movdqa %xmm13,%xmm9
2164
movdqa %xmm2,48-128(%rax)
2165
paddd %xmm2,%xmm12
2166
pxor %xmm0,%xmm3
2167
psrld $27,%xmm9
2168
pxor %xmm10,%xmm6
2169
movdqa %xmm14,%xmm7
2170
2171
pslld $30,%xmm7
2172
movdqa %xmm3,%xmm5
2173
por %xmm9,%xmm8
2174
psrld $31,%xmm5
2175
paddd %xmm6,%xmm12
2176
paddd %xmm3,%xmm3
2177
2178
psrld $2,%xmm14
2179
paddd %xmm8,%xmm12
2180
por %xmm5,%xmm3
2181
por %xmm7,%xmm14
2182
pxor %xmm1,%xmm4
2183
movdqa 112-128(%rax),%xmm1
2184
2185
movdqa %xmm12,%xmm8
2186
movdqa %xmm10,%xmm6
2187
pxor 208-128(%rax),%xmm4
2188
paddd %xmm15,%xmm11
2189
pslld $5,%xmm8
2190
pxor %xmm13,%xmm6
2191
2192
movdqa %xmm12,%xmm9
2193
movdqa %xmm3,64-128(%rax)
2194
paddd %xmm3,%xmm11
2195
pxor %xmm1,%xmm4
2196
psrld $27,%xmm9
2197
pxor %xmm14,%xmm6
2198
movdqa %xmm13,%xmm7
2199
2200
pslld $30,%xmm7
2201
movdqa %xmm4,%xmm5
2202
por %xmm9,%xmm8
2203
psrld $31,%xmm5
2204
paddd %xmm6,%xmm11
2205
paddd %xmm4,%xmm4
2206
2207
psrld $2,%xmm13
2208
paddd %xmm8,%xmm11
2209
por %xmm5,%xmm4
2210
por %xmm7,%xmm13
2211
pxor %xmm2,%xmm0
2212
movdqa 128-128(%rax),%xmm2
2213
2214
movdqa %xmm11,%xmm8
2215
movdqa %xmm14,%xmm6
2216
pxor 224-128(%rax),%xmm0
2217
paddd %xmm15,%xmm10
2218
pslld $5,%xmm8
2219
pxor %xmm12,%xmm6
2220
2221
movdqa %xmm11,%xmm9
2222
movdqa %xmm4,80-128(%rax)
2223
paddd %xmm4,%xmm10
2224
pxor %xmm2,%xmm0
2225
psrld $27,%xmm9
2226
pxor %xmm13,%xmm6
2227
movdqa %xmm12,%xmm7
2228
2229
pslld $30,%xmm7
2230
movdqa %xmm0,%xmm5
2231
por %xmm9,%xmm8
2232
psrld $31,%xmm5
2233
paddd %xmm6,%xmm10
2234
paddd %xmm0,%xmm0
2235
2236
psrld $2,%xmm12
2237
paddd %xmm8,%xmm10
2238
por %xmm5,%xmm0
2239
por %xmm7,%xmm12
2240
pxor %xmm3,%xmm1
2241
movdqa 144-128(%rax),%xmm3
2242
2243
movdqa %xmm10,%xmm8
2244
movdqa %xmm13,%xmm6
2245
pxor 240-128(%rax),%xmm1
2246
paddd %xmm15,%xmm14
2247
pslld $5,%xmm8
2248
pxor %xmm11,%xmm6
2249
2250
movdqa %xmm10,%xmm9
2251
movdqa %xmm0,96-128(%rax)
2252
paddd %xmm0,%xmm14
2253
pxor %xmm3,%xmm1
2254
psrld $27,%xmm9
2255
pxor %xmm12,%xmm6
2256
movdqa %xmm11,%xmm7
2257
2258
pslld $30,%xmm7
2259
movdqa %xmm1,%xmm5
2260
por %xmm9,%xmm8
2261
psrld $31,%xmm5
2262
paddd %xmm6,%xmm14
2263
paddd %xmm1,%xmm1
2264
2265
psrld $2,%xmm11
2266
paddd %xmm8,%xmm14
2267
por %xmm5,%xmm1
2268
por %xmm7,%xmm11
2269
pxor %xmm4,%xmm2
2270
movdqa 160-128(%rax),%xmm4
2271
2272
movdqa %xmm14,%xmm8
2273
movdqa %xmm12,%xmm6
2274
pxor 0-128(%rax),%xmm2
2275
paddd %xmm15,%xmm13
2276
pslld $5,%xmm8
2277
pxor %xmm10,%xmm6
2278
2279
movdqa %xmm14,%xmm9
2280
movdqa %xmm1,112-128(%rax)
2281
paddd %xmm1,%xmm13
2282
pxor %xmm4,%xmm2
2283
psrld $27,%xmm9
2284
pxor %xmm11,%xmm6
2285
movdqa %xmm10,%xmm7
2286
2287
pslld $30,%xmm7
2288
movdqa %xmm2,%xmm5
2289
por %xmm9,%xmm8
2290
psrld $31,%xmm5
2291
paddd %xmm6,%xmm13
2292
paddd %xmm2,%xmm2
2293
2294
psrld $2,%xmm10
2295
paddd %xmm8,%xmm13
2296
por %xmm5,%xmm2
2297
por %xmm7,%xmm10
2298
pxor %xmm0,%xmm3
2299
movdqa 176-128(%rax),%xmm0
2300
2301
movdqa %xmm13,%xmm8
2302
movdqa %xmm11,%xmm6
2303
pxor 16-128(%rax),%xmm3
2304
paddd %xmm15,%xmm12
2305
pslld $5,%xmm8
2306
pxor %xmm14,%xmm6
2307
2308
movdqa %xmm13,%xmm9
2309
paddd %xmm2,%xmm12
2310
pxor %xmm0,%xmm3
2311
psrld $27,%xmm9
2312
pxor %xmm10,%xmm6
2313
movdqa %xmm14,%xmm7
2314
2315
pslld $30,%xmm7
2316
movdqa %xmm3,%xmm5
2317
por %xmm9,%xmm8
2318
psrld $31,%xmm5
2319
paddd %xmm6,%xmm12
2320
paddd %xmm3,%xmm3
2321
2322
psrld $2,%xmm14
2323
paddd %xmm8,%xmm12
2324
por %xmm5,%xmm3
2325
por %xmm7,%xmm14
2326
pxor %xmm1,%xmm4
2327
movdqa 192-128(%rax),%xmm1
2328
2329
movdqa %xmm12,%xmm8
2330
movdqa %xmm10,%xmm6
2331
pxor 32-128(%rax),%xmm4
2332
paddd %xmm15,%xmm11
2333
pslld $5,%xmm8
2334
pxor %xmm13,%xmm6
2335
2336
movdqa %xmm12,%xmm9
2337
paddd %xmm3,%xmm11
2338
pxor %xmm1,%xmm4
2339
psrld $27,%xmm9
2340
pxor %xmm14,%xmm6
2341
movdqa %xmm13,%xmm7
2342
2343
pslld $30,%xmm7
2344
movdqa %xmm4,%xmm5
2345
por %xmm9,%xmm8
2346
psrld $31,%xmm5
2347
paddd %xmm6,%xmm11
2348
paddd %xmm4,%xmm4
2349
2350
psrld $2,%xmm13
2351
paddd %xmm8,%xmm11
2352
por %xmm5,%xmm4
2353
por %xmm7,%xmm13
2354
pxor %xmm2,%xmm0
2355
movdqa 208-128(%rax),%xmm2
2356
2357
movdqa %xmm11,%xmm8
2358
movdqa %xmm14,%xmm6
2359
pxor 48-128(%rax),%xmm0
2360
paddd %xmm15,%xmm10
2361
pslld $5,%xmm8
2362
pxor %xmm12,%xmm6
2363
2364
movdqa %xmm11,%xmm9
2365
paddd %xmm4,%xmm10
2366
pxor %xmm2,%xmm0
2367
psrld $27,%xmm9
2368
pxor %xmm13,%xmm6
2369
movdqa %xmm12,%xmm7
2370
2371
pslld $30,%xmm7
2372
movdqa %xmm0,%xmm5
2373
por %xmm9,%xmm8
2374
psrld $31,%xmm5
2375
paddd %xmm6,%xmm10
2376
paddd %xmm0,%xmm0
2377
2378
psrld $2,%xmm12
2379
paddd %xmm8,%xmm10
2380
por %xmm5,%xmm0
2381
por %xmm7,%xmm12
2382
pxor %xmm3,%xmm1
2383
movdqa 224-128(%rax),%xmm3
2384
2385
movdqa %xmm10,%xmm8
2386
movdqa %xmm13,%xmm6
2387
pxor 64-128(%rax),%xmm1
2388
paddd %xmm15,%xmm14
2389
pslld $5,%xmm8
2390
pxor %xmm11,%xmm6
2391
2392
movdqa %xmm10,%xmm9
2393
paddd %xmm0,%xmm14
2394
pxor %xmm3,%xmm1
2395
psrld $27,%xmm9
2396
pxor %xmm12,%xmm6
2397
movdqa %xmm11,%xmm7
2398
2399
pslld $30,%xmm7
2400
movdqa %xmm1,%xmm5
2401
por %xmm9,%xmm8
2402
psrld $31,%xmm5
2403
paddd %xmm6,%xmm14
2404
paddd %xmm1,%xmm1
2405
2406
psrld $2,%xmm11
2407
paddd %xmm8,%xmm14
2408
por %xmm5,%xmm1
2409
por %xmm7,%xmm11
2410
pxor %xmm4,%xmm2
2411
movdqa 240-128(%rax),%xmm4
2412
2413
movdqa %xmm14,%xmm8
2414
movdqa %xmm12,%xmm6
2415
pxor 80-128(%rax),%xmm2
2416
paddd %xmm15,%xmm13
2417
pslld $5,%xmm8
2418
pxor %xmm10,%xmm6
2419
2420
movdqa %xmm14,%xmm9
2421
paddd %xmm1,%xmm13
2422
pxor %xmm4,%xmm2
2423
psrld $27,%xmm9
2424
pxor %xmm11,%xmm6
2425
movdqa %xmm10,%xmm7
2426
2427
pslld $30,%xmm7
2428
movdqa %xmm2,%xmm5
2429
por %xmm9,%xmm8
2430
psrld $31,%xmm5
2431
paddd %xmm6,%xmm13
2432
paddd %xmm2,%xmm2
2433
2434
psrld $2,%xmm10
2435
paddd %xmm8,%xmm13
2436
por %xmm5,%xmm2
2437
por %xmm7,%xmm10
2438
pxor %xmm0,%xmm3
2439
movdqa 0-128(%rax),%xmm0
2440
2441
movdqa %xmm13,%xmm8
2442
movdqa %xmm11,%xmm6
2443
pxor 96-128(%rax),%xmm3
2444
paddd %xmm15,%xmm12
2445
pslld $5,%xmm8
2446
pxor %xmm14,%xmm6
2447
2448
movdqa %xmm13,%xmm9
2449
paddd %xmm2,%xmm12
2450
pxor %xmm0,%xmm3
2451
psrld $27,%xmm9
2452
pxor %xmm10,%xmm6
2453
movdqa %xmm14,%xmm7
2454
2455
pslld $30,%xmm7
2456
movdqa %xmm3,%xmm5
2457
por %xmm9,%xmm8
2458
psrld $31,%xmm5
2459
paddd %xmm6,%xmm12
2460
paddd %xmm3,%xmm3
2461
2462
psrld $2,%xmm14
2463
paddd %xmm8,%xmm12
2464
por %xmm5,%xmm3
2465
por %xmm7,%xmm14
2466
pxor %xmm1,%xmm4
2467
movdqa 16-128(%rax),%xmm1
2468
2469
movdqa %xmm12,%xmm8
2470
movdqa %xmm10,%xmm6
2471
pxor 112-128(%rax),%xmm4
2472
paddd %xmm15,%xmm11
2473
pslld $5,%xmm8
2474
pxor %xmm13,%xmm6
2475
2476
movdqa %xmm12,%xmm9
2477
paddd %xmm3,%xmm11
2478
pxor %xmm1,%xmm4
2479
psrld $27,%xmm9
2480
pxor %xmm14,%xmm6
2481
movdqa %xmm13,%xmm7
2482
2483
pslld $30,%xmm7
2484
movdqa %xmm4,%xmm5
2485
por %xmm9,%xmm8
2486
psrld $31,%xmm5
2487
paddd %xmm6,%xmm11
2488
paddd %xmm4,%xmm4
2489
2490
psrld $2,%xmm13
2491
paddd %xmm8,%xmm11
2492
por %xmm5,%xmm4
2493
por %xmm7,%xmm13
2494
movdqa %xmm11,%xmm8
2495
paddd %xmm15,%xmm10
2496
movdqa %xmm14,%xmm6
2497
pslld $5,%xmm8
2498
pxor %xmm12,%xmm6
2499
2500
movdqa %xmm11,%xmm9
2501
paddd %xmm4,%xmm10
2502
psrld $27,%xmm9
2503
movdqa %xmm12,%xmm7
2504
pxor %xmm13,%xmm6
2505
2506
pslld $30,%xmm7
2507
por %xmm9,%xmm8
2508
paddd %xmm6,%xmm10
2509
2510
psrld $2,%xmm12
2511
paddd %xmm8,%xmm10
2512
por %xmm7,%xmm12
2513
movdqa (%rbx),%xmm0
2514
movl $1,%ecx
2515
cmpl 0(%rbx),%ecx
2516
pxor %xmm8,%xmm8
2517
cmovgeq %rbp,%r8
2518
cmpl 4(%rbx),%ecx
2519
movdqa %xmm0,%xmm1
2520
cmovgeq %rbp,%r9
2521
cmpl 8(%rbx),%ecx
2522
pcmpgtd %xmm8,%xmm1
2523
cmovgeq %rbp,%r10
2524
cmpl 12(%rbx),%ecx
2525
paddd %xmm1,%xmm0
2526
cmovgeq %rbp,%r11
2527
2528
movdqu 0(%rdi),%xmm6
2529
pand %xmm1,%xmm10
2530
movdqu 32(%rdi),%xmm7
2531
pand %xmm1,%xmm11
2532
paddd %xmm6,%xmm10
2533
movdqu 64(%rdi),%xmm8
2534
pand %xmm1,%xmm12
2535
paddd %xmm7,%xmm11
2536
movdqu 96(%rdi),%xmm9
2537
pand %xmm1,%xmm13
2538
paddd %xmm8,%xmm12
2539
movdqu 128(%rdi),%xmm5
2540
pand %xmm1,%xmm14
2541
movdqu %xmm10,0(%rdi)
2542
paddd %xmm9,%xmm13
2543
movdqu %xmm11,32(%rdi)
2544
paddd %xmm5,%xmm14
2545
movdqu %xmm12,64(%rdi)
2546
movdqu %xmm13,96(%rdi)
2547
movdqu %xmm14,128(%rdi)
2548
2549
movdqa %xmm0,(%rbx)
2550
movdqa 96(%rbp),%xmm5
2551
movdqa -32(%rbp),%xmm15
2552
decl %edx
2553
jnz .Loop
2554
2555
movl 280(%rsp),%edx
2556
leaq 16(%rdi),%rdi
2557
leaq 64(%rsi),%rsi
2558
decl %edx
2559
jnz .Loop_grande
2560
2561
.Ldone:
2562
movq 272(%rsp),%rax
2563
.cfi_def_cfa %rax,8
2564
movq -16(%rax),%rbp
2565
.cfi_restore %rbp
2566
movq -8(%rax),%rbx
2567
.cfi_restore %rbx
2568
leaq (%rax),%rsp
2569
.cfi_def_cfa_register %rsp
2570
.Lepilogue:
2571
.byte 0xf3,0xc3
2572
.cfi_endproc
2573
.size sha1_multi_block,.-sha1_multi_block
2574
.type sha1_multi_block_shaext,@function
2575
.align 32
2576
sha1_multi_block_shaext:
2577
.cfi_startproc
2578
_shaext_shortcut:
2579
movq %rsp,%rax
2580
.cfi_def_cfa_register %rax
2581
pushq %rbx
2582
.cfi_offset %rbx,-16
2583
pushq %rbp
2584
.cfi_offset %rbp,-24
2585
subq $288,%rsp
2586
shll $1,%edx
2587
andq $-256,%rsp
2588
leaq 64(%rdi),%rdi
2589
movq %rax,272(%rsp)
2590
.Lbody_shaext:
2591
leaq 256(%rsp),%rbx
2592
movdqa K_XX_XX+128(%rip),%xmm3
2593
2594
.Loop_grande_shaext:
2595
movl %edx,280(%rsp)
2596
xorl %edx,%edx
2597
2598
movq 0(%rsi),%r8
2599
2600
movl 8(%rsi),%ecx
2601
cmpl %edx,%ecx
2602
cmovgl %ecx,%edx
2603
testl %ecx,%ecx
2604
movl %ecx,0(%rbx)
2605
cmovleq %rsp,%r8
2606
2607
movq 16(%rsi),%r9
2608
2609
movl 24(%rsi),%ecx
2610
cmpl %edx,%ecx
2611
cmovgl %ecx,%edx
2612
testl %ecx,%ecx
2613
movl %ecx,4(%rbx)
2614
cmovleq %rsp,%r9
2615
testl %edx,%edx
2616
jz .Ldone_shaext
2617
2618
movq 0-64(%rdi),%xmm0
2619
movq 32-64(%rdi),%xmm4
2620
movq 64-64(%rdi),%xmm5
2621
movq 96-64(%rdi),%xmm6
2622
movq 128-64(%rdi),%xmm7
2623
2624
punpckldq %xmm4,%xmm0
2625
punpckldq %xmm6,%xmm5
2626
2627
movdqa %xmm0,%xmm8
2628
punpcklqdq %xmm5,%xmm0
2629
punpckhqdq %xmm5,%xmm8
2630
2631
pshufd $63,%xmm7,%xmm1
2632
pshufd $127,%xmm7,%xmm9
2633
pshufd $27,%xmm0,%xmm0
2634
pshufd $27,%xmm8,%xmm8
2635
jmp .Loop_shaext
2636
2637
.align 32
2638
.Loop_shaext:
2639
movdqu 0(%r8),%xmm4
2640
movdqu 0(%r9),%xmm11
2641
movdqu 16(%r8),%xmm5
2642
movdqu 16(%r9),%xmm12
2643
movdqu 32(%r8),%xmm6
2644
.byte 102,15,56,0,227
2645
movdqu 32(%r9),%xmm13
2646
.byte 102,68,15,56,0,219
2647
movdqu 48(%r8),%xmm7
2648
leaq 64(%r8),%r8
2649
.byte 102,15,56,0,235
2650
movdqu 48(%r9),%xmm14
2651
leaq 64(%r9),%r9
2652
.byte 102,68,15,56,0,227
2653
2654
movdqa %xmm1,80(%rsp)
2655
paddd %xmm4,%xmm1
2656
movdqa %xmm9,112(%rsp)
2657
paddd %xmm11,%xmm9
2658
movdqa %xmm0,64(%rsp)
2659
movdqa %xmm0,%xmm2
2660
movdqa %xmm8,96(%rsp)
2661
movdqa %xmm8,%xmm10
2662
.byte 15,58,204,193,0
2663
.byte 15,56,200,213
2664
.byte 69,15,58,204,193,0
2665
.byte 69,15,56,200,212
2666
.byte 102,15,56,0,243
2667
prefetcht0 127(%r8)
2668
.byte 15,56,201,229
2669
.byte 102,68,15,56,0,235
2670
prefetcht0 127(%r9)
2671
.byte 69,15,56,201,220
2672
2673
.byte 102,15,56,0,251
2674
movdqa %xmm0,%xmm1
2675
.byte 102,68,15,56,0,243
2676
movdqa %xmm8,%xmm9
2677
.byte 15,58,204,194,0
2678
.byte 15,56,200,206
2679
.byte 69,15,58,204,194,0
2680
.byte 69,15,56,200,205
2681
pxor %xmm6,%xmm4
2682
.byte 15,56,201,238
2683
pxor %xmm13,%xmm11
2684
.byte 69,15,56,201,229
2685
movdqa %xmm0,%xmm2
2686
movdqa %xmm8,%xmm10
2687
.byte 15,58,204,193,0
2688
.byte 15,56,200,215
2689
.byte 69,15,58,204,193,0
2690
.byte 69,15,56,200,214
2691
.byte 15,56,202,231
2692
.byte 69,15,56,202,222
2693
pxor %xmm7,%xmm5
2694
.byte 15,56,201,247
2695
pxor %xmm14,%xmm12
2696
.byte 69,15,56,201,238
2697
movdqa %xmm0,%xmm1
2698
movdqa %xmm8,%xmm9
2699
.byte 15,58,204,194,0
2700
.byte 15,56,200,204
2701
.byte 69,15,58,204,194,0
2702
.byte 69,15,56,200,203
2703
.byte 15,56,202,236
2704
.byte 69,15,56,202,227
2705
pxor %xmm4,%xmm6
2706
.byte 15,56,201,252
2707
pxor %xmm11,%xmm13
2708
.byte 69,15,56,201,243
2709
movdqa %xmm0,%xmm2
2710
movdqa %xmm8,%xmm10
2711
.byte 15,58,204,193,0
2712
.byte 15,56,200,213
2713
.byte 69,15,58,204,193,0
2714
.byte 69,15,56,200,212
2715
.byte 15,56,202,245
2716
.byte 69,15,56,202,236
2717
pxor %xmm5,%xmm7
2718
.byte 15,56,201,229
2719
pxor %xmm12,%xmm14
2720
.byte 69,15,56,201,220
2721
movdqa %xmm0,%xmm1
2722
movdqa %xmm8,%xmm9
2723
.byte 15,58,204,194,1
2724
.byte 15,56,200,206
2725
.byte 69,15,58,204,194,1
2726
.byte 69,15,56,200,205
2727
.byte 15,56,202,254
2728
.byte 69,15,56,202,245
2729
pxor %xmm6,%xmm4
2730
.byte 15,56,201,238
2731
pxor %xmm13,%xmm11
2732
.byte 69,15,56,201,229
2733
movdqa %xmm0,%xmm2
2734
movdqa %xmm8,%xmm10
2735
.byte 15,58,204,193,1
2736
.byte 15,56,200,215
2737
.byte 69,15,58,204,193,1
2738
.byte 69,15,56,200,214
2739
.byte 15,56,202,231
2740
.byte 69,15,56,202,222
2741
pxor %xmm7,%xmm5
2742
.byte 15,56,201,247
2743
pxor %xmm14,%xmm12
2744
.byte 69,15,56,201,238
2745
movdqa %xmm0,%xmm1
2746
movdqa %xmm8,%xmm9
2747
.byte 15,58,204,194,1
2748
.byte 15,56,200,204
2749
.byte 69,15,58,204,194,1
2750
.byte 69,15,56,200,203
2751
.byte 15,56,202,236
2752
.byte 69,15,56,202,227
2753
pxor %xmm4,%xmm6
2754
.byte 15,56,201,252
2755
pxor %xmm11,%xmm13
2756
.byte 69,15,56,201,243
2757
movdqa %xmm0,%xmm2
2758
movdqa %xmm8,%xmm10
2759
.byte 15,58,204,193,1
2760
.byte 15,56,200,213
2761
.byte 69,15,58,204,193,1
2762
.byte 69,15,56,200,212
2763
.byte 15,56,202,245
2764
.byte 69,15,56,202,236
2765
pxor %xmm5,%xmm7
2766
.byte 15,56,201,229
2767
pxor %xmm12,%xmm14
2768
.byte 69,15,56,201,220
2769
movdqa %xmm0,%xmm1
2770
movdqa %xmm8,%xmm9
2771
.byte 15,58,204,194,1
2772
.byte 15,56,200,206
2773
.byte 69,15,58,204,194,1
2774
.byte 69,15,56,200,205
2775
.byte 15,56,202,254
2776
.byte 69,15,56,202,245
2777
pxor %xmm6,%xmm4
2778
.byte 15,56,201,238
2779
pxor %xmm13,%xmm11
2780
.byte 69,15,56,201,229
2781
movdqa %xmm0,%xmm2
2782
movdqa %xmm8,%xmm10
2783
.byte 15,58,204,193,2
2784
.byte 15,56,200,215
2785
.byte 69,15,58,204,193,2
2786
.byte 69,15,56,200,214
2787
.byte 15,56,202,231
2788
.byte 69,15,56,202,222
2789
pxor %xmm7,%xmm5
2790
.byte 15,56,201,247
2791
pxor %xmm14,%xmm12
2792
.byte 69,15,56,201,238
2793
movdqa %xmm0,%xmm1
2794
movdqa %xmm8,%xmm9
2795
.byte 15,58,204,194,2
2796
.byte 15,56,200,204
2797
.byte 69,15,58,204,194,2
2798
.byte 69,15,56,200,203
2799
.byte 15,56,202,236
2800
.byte 69,15,56,202,227
2801
pxor %xmm4,%xmm6
2802
.byte 15,56,201,252
2803
pxor %xmm11,%xmm13
2804
.byte 69,15,56,201,243
2805
movdqa %xmm0,%xmm2
2806
movdqa %xmm8,%xmm10
2807
.byte 15,58,204,193,2
2808
.byte 15,56,200,213
2809
.byte 69,15,58,204,193,2
2810
.byte 69,15,56,200,212
2811
.byte 15,56,202,245
2812
.byte 69,15,56,202,236
2813
pxor %xmm5,%xmm7
2814
.byte 15,56,201,229
2815
pxor %xmm12,%xmm14
2816
.byte 69,15,56,201,220
2817
movdqa %xmm0,%xmm1
2818
movdqa %xmm8,%xmm9
2819
.byte 15,58,204,194,2
2820
.byte 15,56,200,206
2821
.byte 69,15,58,204,194,2
2822
.byte 69,15,56,200,205
2823
.byte 15,56,202,254
2824
.byte 69,15,56,202,245
2825
pxor %xmm6,%xmm4
2826
.byte 15,56,201,238
2827
pxor %xmm13,%xmm11
2828
.byte 69,15,56,201,229
2829
movdqa %xmm0,%xmm2
2830
movdqa %xmm8,%xmm10
2831
.byte 15,58,204,193,2
2832
.byte 15,56,200,215
2833
.byte 69,15,58,204,193,2
2834
.byte 69,15,56,200,214
2835
.byte 15,56,202,231
2836
.byte 69,15,56,202,222
2837
pxor %xmm7,%xmm5
2838
.byte 15,56,201,247
2839
pxor %xmm14,%xmm12
2840
.byte 69,15,56,201,238
2841
movdqa %xmm0,%xmm1
2842
movdqa %xmm8,%xmm9
2843
.byte 15,58,204,194,3
2844
.byte 15,56,200,204
2845
.byte 69,15,58,204,194,3
2846
.byte 69,15,56,200,203
2847
.byte 15,56,202,236
2848
.byte 69,15,56,202,227
2849
pxor %xmm4,%xmm6
2850
.byte 15,56,201,252
2851
pxor %xmm11,%xmm13
2852
.byte 69,15,56,201,243
2853
movdqa %xmm0,%xmm2
2854
movdqa %xmm8,%xmm10
2855
.byte 15,58,204,193,3
2856
.byte 15,56,200,213
2857
.byte 69,15,58,204,193,3
2858
.byte 69,15,56,200,212
2859
.byte 15,56,202,245
2860
.byte 69,15,56,202,236
2861
pxor %xmm5,%xmm7
2862
pxor %xmm12,%xmm14
2863
2864
movl $1,%ecx
2865
pxor %xmm4,%xmm4
2866
cmpl 0(%rbx),%ecx
2867
cmovgeq %rsp,%r8
2868
2869
movdqa %xmm0,%xmm1
2870
movdqa %xmm8,%xmm9
2871
.byte 15,58,204,194,3
2872
.byte 15,56,200,206
2873
.byte 69,15,58,204,194,3
2874
.byte 69,15,56,200,205
2875
.byte 15,56,202,254
2876
.byte 69,15,56,202,245
2877
2878
cmpl 4(%rbx),%ecx
2879
cmovgeq %rsp,%r9
2880
movq (%rbx),%xmm6
2881
2882
movdqa %xmm0,%xmm2
2883
movdqa %xmm8,%xmm10
2884
.byte 15,58,204,193,3
2885
.byte 15,56,200,215
2886
.byte 69,15,58,204,193,3
2887
.byte 69,15,56,200,214
2888
2889
pshufd $0x00,%xmm6,%xmm11
2890
pshufd $0x55,%xmm6,%xmm12
2891
movdqa %xmm6,%xmm7
2892
pcmpgtd %xmm4,%xmm11
2893
pcmpgtd %xmm4,%xmm12
2894
2895
movdqa %xmm0,%xmm1
2896
movdqa %xmm8,%xmm9
2897
.byte 15,58,204,194,3
2898
.byte 15,56,200,204
2899
.byte 69,15,58,204,194,3
2900
.byte 68,15,56,200,204
2901
2902
pcmpgtd %xmm4,%xmm7
2903
pand %xmm11,%xmm0
2904
pand %xmm11,%xmm1
2905
pand %xmm12,%xmm8
2906
pand %xmm12,%xmm9
2907
paddd %xmm7,%xmm6
2908
2909
paddd 64(%rsp),%xmm0
2910
paddd 80(%rsp),%xmm1
2911
paddd 96(%rsp),%xmm8
2912
paddd 112(%rsp),%xmm9
2913
2914
movq %xmm6,(%rbx)
2915
decl %edx
2916
jnz .Loop_shaext
2917
2918
movl 280(%rsp),%edx
2919
2920
pshufd $27,%xmm0,%xmm0
2921
pshufd $27,%xmm8,%xmm8
2922
2923
movdqa %xmm0,%xmm6
2924
punpckldq %xmm8,%xmm0
2925
punpckhdq %xmm8,%xmm6
2926
punpckhdq %xmm9,%xmm1
2927
movq %xmm0,0-64(%rdi)
2928
psrldq $8,%xmm0
2929
movq %xmm6,64-64(%rdi)
2930
psrldq $8,%xmm6
2931
movq %xmm0,32-64(%rdi)
2932
psrldq $8,%xmm1
2933
movq %xmm6,96-64(%rdi)
2934
movq %xmm1,128-64(%rdi)
2935
2936
leaq 8(%rdi),%rdi
2937
leaq 32(%rsi),%rsi
2938
decl %edx
2939
jnz .Loop_grande_shaext
2940
2941
.Ldone_shaext:
2942
2943
movq -16(%rax),%rbp
2944
.cfi_restore %rbp
2945
movq -8(%rax),%rbx
2946
.cfi_restore %rbx
2947
leaq (%rax),%rsp
2948
.cfi_def_cfa_register %rsp
2949
.Lepilogue_shaext:
2950
.byte 0xf3,0xc3
2951
.cfi_endproc
2952
.size sha1_multi_block_shaext,.-sha1_multi_block_shaext
2953
.type sha1_multi_block_avx,@function
2954
.align 32
2955
sha1_multi_block_avx:
2956
.cfi_startproc
2957
_avx_shortcut:
2958
shrq $32,%rcx
2959
cmpl $2,%edx
2960
jb .Lavx
2961
testl $32,%ecx
2962
jnz _avx2_shortcut
2963
jmp .Lavx
2964
.align 32
2965
.Lavx:
2966
movq %rsp,%rax
2967
.cfi_def_cfa_register %rax
2968
pushq %rbx
2969
.cfi_offset %rbx,-16
2970
pushq %rbp
2971
.cfi_offset %rbp,-24
2972
subq $288,%rsp
2973
andq $-256,%rsp
2974
movq %rax,272(%rsp)
2975
.cfi_escape 0x0f,0x06,0x77,0x90,0x02,0x06,0x23,0x08
2976
.Lbody_avx:
2977
leaq K_XX_XX(%rip),%rbp
2978
leaq 256(%rsp),%rbx
2979
2980
vzeroupper
2981
.Loop_grande_avx:
2982
movl %edx,280(%rsp)
2983
xorl %edx,%edx
2984
2985
movq 0(%rsi),%r8
2986
2987
movl 8(%rsi),%ecx
2988
cmpl %edx,%ecx
2989
cmovgl %ecx,%edx
2990
testl %ecx,%ecx
2991
movl %ecx,0(%rbx)
2992
cmovleq %rbp,%r8
2993
2994
movq 16(%rsi),%r9
2995
2996
movl 24(%rsi),%ecx
2997
cmpl %edx,%ecx
2998
cmovgl %ecx,%edx
2999
testl %ecx,%ecx
3000
movl %ecx,4(%rbx)
3001
cmovleq %rbp,%r9
3002
3003
movq 32(%rsi),%r10
3004
3005
movl 40(%rsi),%ecx
3006
cmpl %edx,%ecx
3007
cmovgl %ecx,%edx
3008
testl %ecx,%ecx
3009
movl %ecx,8(%rbx)
3010
cmovleq %rbp,%r10
3011
3012
movq 48(%rsi),%r11
3013
3014
movl 56(%rsi),%ecx
3015
cmpl %edx,%ecx
3016
cmovgl %ecx,%edx
3017
testl %ecx,%ecx
3018
movl %ecx,12(%rbx)
3019
cmovleq %rbp,%r11
3020
testl %edx,%edx
3021
jz .Ldone_avx
3022
3023
vmovdqu 0(%rdi),%xmm10
3024
leaq 128(%rsp),%rax
3025
vmovdqu 32(%rdi),%xmm11
3026
vmovdqu 64(%rdi),%xmm12
3027
vmovdqu 96(%rdi),%xmm13
3028
vmovdqu 128(%rdi),%xmm14
3029
vmovdqu 96(%rbp),%xmm5
3030
jmp .Loop_avx
3031
3032
.align 32
3033
.Loop_avx:
3034
vmovdqa -32(%rbp),%xmm15
3035
vmovd (%r8),%xmm0
3036
leaq 64(%r8),%r8
3037
vmovd (%r9),%xmm2
3038
leaq 64(%r9),%r9
3039
vpinsrd $1,(%r10),%xmm0,%xmm0
3040
leaq 64(%r10),%r10
3041
vpinsrd $1,(%r11),%xmm2,%xmm2
3042
leaq 64(%r11),%r11
3043
vmovd -60(%r8),%xmm1
3044
vpunpckldq %xmm2,%xmm0,%xmm0
3045
vmovd -60(%r9),%xmm9
3046
vpshufb %xmm5,%xmm0,%xmm0
3047
vpinsrd $1,-60(%r10),%xmm1,%xmm1
3048
vpinsrd $1,-60(%r11),%xmm9,%xmm9
3049
vpaddd %xmm15,%xmm14,%xmm14
3050
vpslld $5,%xmm10,%xmm8
3051
vpandn %xmm13,%xmm11,%xmm7
3052
vpand %xmm12,%xmm11,%xmm6
3053
3054
vmovdqa %xmm0,0-128(%rax)
3055
vpaddd %xmm0,%xmm14,%xmm14
3056
vpunpckldq %xmm9,%xmm1,%xmm1
3057
vpsrld $27,%xmm10,%xmm9
3058
vpxor %xmm7,%xmm6,%xmm6
3059
vmovd -56(%r8),%xmm2
3060
3061
vpslld $30,%xmm11,%xmm7
3062
vpor %xmm9,%xmm8,%xmm8
3063
vmovd -56(%r9),%xmm9
3064
vpaddd %xmm6,%xmm14,%xmm14
3065
3066
vpsrld $2,%xmm11,%xmm11
3067
vpaddd %xmm8,%xmm14,%xmm14
3068
vpshufb %xmm5,%xmm1,%xmm1
3069
vpor %xmm7,%xmm11,%xmm11
3070
vpinsrd $1,-56(%r10),%xmm2,%xmm2
3071
vpinsrd $1,-56(%r11),%xmm9,%xmm9
3072
vpaddd %xmm15,%xmm13,%xmm13
3073
vpslld $5,%xmm14,%xmm8
3074
vpandn %xmm12,%xmm10,%xmm7
3075
vpand %xmm11,%xmm10,%xmm6
3076
3077
vmovdqa %xmm1,16-128(%rax)
3078
vpaddd %xmm1,%xmm13,%xmm13
3079
vpunpckldq %xmm9,%xmm2,%xmm2
3080
vpsrld $27,%xmm14,%xmm9
3081
vpxor %xmm7,%xmm6,%xmm6
3082
vmovd -52(%r8),%xmm3
3083
3084
vpslld $30,%xmm10,%xmm7
3085
vpor %xmm9,%xmm8,%xmm8
3086
vmovd -52(%r9),%xmm9
3087
vpaddd %xmm6,%xmm13,%xmm13
3088
3089
vpsrld $2,%xmm10,%xmm10
3090
vpaddd %xmm8,%xmm13,%xmm13
3091
vpshufb %xmm5,%xmm2,%xmm2
3092
vpor %xmm7,%xmm10,%xmm10
3093
vpinsrd $1,-52(%r10),%xmm3,%xmm3
3094
vpinsrd $1,-52(%r11),%xmm9,%xmm9
3095
vpaddd %xmm15,%xmm12,%xmm12
3096
vpslld $5,%xmm13,%xmm8
3097
vpandn %xmm11,%xmm14,%xmm7
3098
vpand %xmm10,%xmm14,%xmm6
3099
3100
vmovdqa %xmm2,32-128(%rax)
3101
vpaddd %xmm2,%xmm12,%xmm12
3102
vpunpckldq %xmm9,%xmm3,%xmm3
3103
vpsrld $27,%xmm13,%xmm9
3104
vpxor %xmm7,%xmm6,%xmm6
3105
vmovd -48(%r8),%xmm4
3106
3107
vpslld $30,%xmm14,%xmm7
3108
vpor %xmm9,%xmm8,%xmm8
3109
vmovd -48(%r9),%xmm9
3110
vpaddd %xmm6,%xmm12,%xmm12
3111
3112
vpsrld $2,%xmm14,%xmm14
3113
vpaddd %xmm8,%xmm12,%xmm12
3114
vpshufb %xmm5,%xmm3,%xmm3
3115
vpor %xmm7,%xmm14,%xmm14
3116
vpinsrd $1,-48(%r10),%xmm4,%xmm4
3117
vpinsrd $1,-48(%r11),%xmm9,%xmm9
3118
vpaddd %xmm15,%xmm11,%xmm11
3119
vpslld $5,%xmm12,%xmm8
3120
vpandn %xmm10,%xmm13,%xmm7
3121
vpand %xmm14,%xmm13,%xmm6
3122
3123
vmovdqa %xmm3,48-128(%rax)
3124
vpaddd %xmm3,%xmm11,%xmm11
3125
vpunpckldq %xmm9,%xmm4,%xmm4
3126
vpsrld $27,%xmm12,%xmm9
3127
vpxor %xmm7,%xmm6,%xmm6
3128
vmovd -44(%r8),%xmm0
3129
3130
vpslld $30,%xmm13,%xmm7
3131
vpor %xmm9,%xmm8,%xmm8
3132
vmovd -44(%r9),%xmm9
3133
vpaddd %xmm6,%xmm11,%xmm11
3134
3135
vpsrld $2,%xmm13,%xmm13
3136
vpaddd %xmm8,%xmm11,%xmm11
3137
vpshufb %xmm5,%xmm4,%xmm4
3138
vpor %xmm7,%xmm13,%xmm13
3139
vpinsrd $1,-44(%r10),%xmm0,%xmm0
3140
vpinsrd $1,-44(%r11),%xmm9,%xmm9
3141
vpaddd %xmm15,%xmm10,%xmm10
3142
vpslld $5,%xmm11,%xmm8
3143
vpandn %xmm14,%xmm12,%xmm7
3144
vpand %xmm13,%xmm12,%xmm6
3145
3146
vmovdqa %xmm4,64-128(%rax)
3147
vpaddd %xmm4,%xmm10,%xmm10
3148
vpunpckldq %xmm9,%xmm0,%xmm0
3149
vpsrld $27,%xmm11,%xmm9
3150
vpxor %xmm7,%xmm6,%xmm6
3151
vmovd -40(%r8),%xmm1
3152
3153
vpslld $30,%xmm12,%xmm7
3154
vpor %xmm9,%xmm8,%xmm8
3155
vmovd -40(%r9),%xmm9
3156
vpaddd %xmm6,%xmm10,%xmm10
3157
3158
vpsrld $2,%xmm12,%xmm12
3159
vpaddd %xmm8,%xmm10,%xmm10
3160
vpshufb %xmm5,%xmm0,%xmm0
3161
vpor %xmm7,%xmm12,%xmm12
3162
vpinsrd $1,-40(%r10),%xmm1,%xmm1
3163
vpinsrd $1,-40(%r11),%xmm9,%xmm9
3164
vpaddd %xmm15,%xmm14,%xmm14
3165
vpslld $5,%xmm10,%xmm8
3166
vpandn %xmm13,%xmm11,%xmm7
3167
vpand %xmm12,%xmm11,%xmm6
3168
3169
vmovdqa %xmm0,80-128(%rax)
3170
vpaddd %xmm0,%xmm14,%xmm14
3171
vpunpckldq %xmm9,%xmm1,%xmm1
3172
vpsrld $27,%xmm10,%xmm9
3173
vpxor %xmm7,%xmm6,%xmm6
3174
vmovd -36(%r8),%xmm2
3175
3176
vpslld $30,%xmm11,%xmm7
3177
vpor %xmm9,%xmm8,%xmm8
3178
vmovd -36(%r9),%xmm9
3179
vpaddd %xmm6,%xmm14,%xmm14
3180
3181
vpsrld $2,%xmm11,%xmm11
3182
vpaddd %xmm8,%xmm14,%xmm14
3183
vpshufb %xmm5,%xmm1,%xmm1
3184
vpor %xmm7,%xmm11,%xmm11
3185
vpinsrd $1,-36(%r10),%xmm2,%xmm2
3186
vpinsrd $1,-36(%r11),%xmm9,%xmm9
3187
vpaddd %xmm15,%xmm13,%xmm13
3188
vpslld $5,%xmm14,%xmm8
3189
vpandn %xmm12,%xmm10,%xmm7
3190
vpand %xmm11,%xmm10,%xmm6
3191
3192
vmovdqa %xmm1,96-128(%rax)
3193
vpaddd %xmm1,%xmm13,%xmm13
3194
vpunpckldq %xmm9,%xmm2,%xmm2
3195
vpsrld $27,%xmm14,%xmm9
3196
vpxor %xmm7,%xmm6,%xmm6
3197
vmovd -32(%r8),%xmm3
3198
3199
vpslld $30,%xmm10,%xmm7
3200
vpor %xmm9,%xmm8,%xmm8
3201
vmovd -32(%r9),%xmm9
3202
vpaddd %xmm6,%xmm13,%xmm13
3203
3204
vpsrld $2,%xmm10,%xmm10
3205
vpaddd %xmm8,%xmm13,%xmm13
3206
vpshufb %xmm5,%xmm2,%xmm2
3207
vpor %xmm7,%xmm10,%xmm10
3208
vpinsrd $1,-32(%r10),%xmm3,%xmm3
3209
vpinsrd $1,-32(%r11),%xmm9,%xmm9
3210
vpaddd %xmm15,%xmm12,%xmm12
3211
vpslld $5,%xmm13,%xmm8
3212
vpandn %xmm11,%xmm14,%xmm7
3213
vpand %xmm10,%xmm14,%xmm6
3214
3215
vmovdqa %xmm2,112-128(%rax)
3216
vpaddd %xmm2,%xmm12,%xmm12
3217
vpunpckldq %xmm9,%xmm3,%xmm3
3218
vpsrld $27,%xmm13,%xmm9
3219
vpxor %xmm7,%xmm6,%xmm6
3220
vmovd -28(%r8),%xmm4
3221
3222
vpslld $30,%xmm14,%xmm7
3223
vpor %xmm9,%xmm8,%xmm8
3224
vmovd -28(%r9),%xmm9
3225
vpaddd %xmm6,%xmm12,%xmm12
3226
3227
vpsrld $2,%xmm14,%xmm14
3228
vpaddd %xmm8,%xmm12,%xmm12
3229
vpshufb %xmm5,%xmm3,%xmm3
3230
vpor %xmm7,%xmm14,%xmm14
3231
vpinsrd $1,-28(%r10),%xmm4,%xmm4
3232
vpinsrd $1,-28(%r11),%xmm9,%xmm9
3233
vpaddd %xmm15,%xmm11,%xmm11
3234
vpslld $5,%xmm12,%xmm8
3235
vpandn %xmm10,%xmm13,%xmm7
3236
vpand %xmm14,%xmm13,%xmm6
3237
3238
vmovdqa %xmm3,128-128(%rax)
3239
vpaddd %xmm3,%xmm11,%xmm11
3240
vpunpckldq %xmm9,%xmm4,%xmm4
3241
vpsrld $27,%xmm12,%xmm9
3242
vpxor %xmm7,%xmm6,%xmm6
3243
vmovd -24(%r8),%xmm0
3244
3245
vpslld $30,%xmm13,%xmm7
3246
vpor %xmm9,%xmm8,%xmm8
3247
vmovd -24(%r9),%xmm9
3248
vpaddd %xmm6,%xmm11,%xmm11
3249
3250
vpsrld $2,%xmm13,%xmm13
3251
vpaddd %xmm8,%xmm11,%xmm11
3252
vpshufb %xmm5,%xmm4,%xmm4
3253
vpor %xmm7,%xmm13,%xmm13
3254
vpinsrd $1,-24(%r10),%xmm0,%xmm0
3255
vpinsrd $1,-24(%r11),%xmm9,%xmm9
3256
vpaddd %xmm15,%xmm10,%xmm10
3257
vpslld $5,%xmm11,%xmm8
3258
vpandn %xmm14,%xmm12,%xmm7
3259
vpand %xmm13,%xmm12,%xmm6
3260
3261
vmovdqa %xmm4,144-128(%rax)
3262
vpaddd %xmm4,%xmm10,%xmm10
3263
vpunpckldq %xmm9,%xmm0,%xmm0
3264
vpsrld $27,%xmm11,%xmm9
3265
vpxor %xmm7,%xmm6,%xmm6
3266
vmovd -20(%r8),%xmm1
3267
3268
vpslld $30,%xmm12,%xmm7
3269
vpor %xmm9,%xmm8,%xmm8
3270
vmovd -20(%r9),%xmm9
3271
vpaddd %xmm6,%xmm10,%xmm10
3272
3273
vpsrld $2,%xmm12,%xmm12
3274
vpaddd %xmm8,%xmm10,%xmm10
3275
vpshufb %xmm5,%xmm0,%xmm0
3276
vpor %xmm7,%xmm12,%xmm12
3277
vpinsrd $1,-20(%r10),%xmm1,%xmm1
3278
vpinsrd $1,-20(%r11),%xmm9,%xmm9
3279
vpaddd %xmm15,%xmm14,%xmm14
3280
vpslld $5,%xmm10,%xmm8
3281
vpandn %xmm13,%xmm11,%xmm7
3282
vpand %xmm12,%xmm11,%xmm6
3283
3284
vmovdqa %xmm0,160-128(%rax)
3285
vpaddd %xmm0,%xmm14,%xmm14
3286
vpunpckldq %xmm9,%xmm1,%xmm1
3287
vpsrld $27,%xmm10,%xmm9
3288
vpxor %xmm7,%xmm6,%xmm6
3289
vmovd -16(%r8),%xmm2
3290
3291
vpslld $30,%xmm11,%xmm7
3292
vpor %xmm9,%xmm8,%xmm8
3293
vmovd -16(%r9),%xmm9
3294
vpaddd %xmm6,%xmm14,%xmm14
3295
3296
vpsrld $2,%xmm11,%xmm11
3297
vpaddd %xmm8,%xmm14,%xmm14
3298
vpshufb %xmm5,%xmm1,%xmm1
3299
vpor %xmm7,%xmm11,%xmm11
3300
vpinsrd $1,-16(%r10),%xmm2,%xmm2
3301
vpinsrd $1,-16(%r11),%xmm9,%xmm9
3302
vpaddd %xmm15,%xmm13,%xmm13
3303
vpslld $5,%xmm14,%xmm8
3304
vpandn %xmm12,%xmm10,%xmm7
3305
vpand %xmm11,%xmm10,%xmm6
3306
3307
vmovdqa %xmm1,176-128(%rax)
3308
vpaddd %xmm1,%xmm13,%xmm13
3309
vpunpckldq %xmm9,%xmm2,%xmm2
3310
vpsrld $27,%xmm14,%xmm9
3311
vpxor %xmm7,%xmm6,%xmm6
3312
vmovd -12(%r8),%xmm3
3313
3314
vpslld $30,%xmm10,%xmm7
3315
vpor %xmm9,%xmm8,%xmm8
3316
vmovd -12(%r9),%xmm9
3317
vpaddd %xmm6,%xmm13,%xmm13
3318
3319
vpsrld $2,%xmm10,%xmm10
3320
vpaddd %xmm8,%xmm13,%xmm13
3321
vpshufb %xmm5,%xmm2,%xmm2
3322
vpor %xmm7,%xmm10,%xmm10
3323
vpinsrd $1,-12(%r10),%xmm3,%xmm3
3324
vpinsrd $1,-12(%r11),%xmm9,%xmm9
3325
vpaddd %xmm15,%xmm12,%xmm12
3326
vpslld $5,%xmm13,%xmm8
3327
vpandn %xmm11,%xmm14,%xmm7
3328
vpand %xmm10,%xmm14,%xmm6
3329
3330
vmovdqa %xmm2,192-128(%rax)
3331
vpaddd %xmm2,%xmm12,%xmm12
3332
vpunpckldq %xmm9,%xmm3,%xmm3
3333
vpsrld $27,%xmm13,%xmm9
3334
vpxor %xmm7,%xmm6,%xmm6
3335
vmovd -8(%r8),%xmm4
3336
3337
vpslld $30,%xmm14,%xmm7
3338
vpor %xmm9,%xmm8,%xmm8
3339
vmovd -8(%r9),%xmm9
3340
vpaddd %xmm6,%xmm12,%xmm12
3341
3342
vpsrld $2,%xmm14,%xmm14
3343
vpaddd %xmm8,%xmm12,%xmm12
3344
vpshufb %xmm5,%xmm3,%xmm3
3345
vpor %xmm7,%xmm14,%xmm14
3346
vpinsrd $1,-8(%r10),%xmm4,%xmm4
3347
vpinsrd $1,-8(%r11),%xmm9,%xmm9
3348
vpaddd %xmm15,%xmm11,%xmm11
3349
vpslld $5,%xmm12,%xmm8
3350
vpandn %xmm10,%xmm13,%xmm7
3351
vpand %xmm14,%xmm13,%xmm6
3352
3353
vmovdqa %xmm3,208-128(%rax)
3354
vpaddd %xmm3,%xmm11,%xmm11
3355
vpunpckldq %xmm9,%xmm4,%xmm4
3356
vpsrld $27,%xmm12,%xmm9
3357
vpxor %xmm7,%xmm6,%xmm6
3358
vmovd -4(%r8),%xmm0
3359
3360
vpslld $30,%xmm13,%xmm7
3361
vpor %xmm9,%xmm8,%xmm8
3362
vmovd -4(%r9),%xmm9
3363
vpaddd %xmm6,%xmm11,%xmm11
3364
3365
vpsrld $2,%xmm13,%xmm13
3366
vpaddd %xmm8,%xmm11,%xmm11
3367
vpshufb %xmm5,%xmm4,%xmm4
3368
vpor %xmm7,%xmm13,%xmm13
3369
vmovdqa 0-128(%rax),%xmm1
3370
vpinsrd $1,-4(%r10),%xmm0,%xmm0
3371
vpinsrd $1,-4(%r11),%xmm9,%xmm9
3372
vpaddd %xmm15,%xmm10,%xmm10
3373
prefetcht0 63(%r8)
3374
vpslld $5,%xmm11,%xmm8
3375
vpandn %xmm14,%xmm12,%xmm7
3376
vpand %xmm13,%xmm12,%xmm6
3377
3378
vmovdqa %xmm4,224-128(%rax)
3379
vpaddd %xmm4,%xmm10,%xmm10
3380
vpunpckldq %xmm9,%xmm0,%xmm0
3381
vpsrld $27,%xmm11,%xmm9
3382
prefetcht0 63(%r9)
3383
vpxor %xmm7,%xmm6,%xmm6
3384
3385
vpslld $30,%xmm12,%xmm7
3386
vpor %xmm9,%xmm8,%xmm8
3387
prefetcht0 63(%r10)
3388
vpaddd %xmm6,%xmm10,%xmm10
3389
3390
vpsrld $2,%xmm12,%xmm12
3391
vpaddd %xmm8,%xmm10,%xmm10
3392
prefetcht0 63(%r11)
3393
vpshufb %xmm5,%xmm0,%xmm0
3394
vpor %xmm7,%xmm12,%xmm12
3395
vmovdqa 16-128(%rax),%xmm2
3396
vpxor %xmm3,%xmm1,%xmm1
3397
vmovdqa 32-128(%rax),%xmm3
3398
3399
vpaddd %xmm15,%xmm14,%xmm14
3400
vpslld $5,%xmm10,%xmm8
3401
vpandn %xmm13,%xmm11,%xmm7
3402
3403
vpand %xmm12,%xmm11,%xmm6
3404
3405
vmovdqa %xmm0,240-128(%rax)
3406
vpaddd %xmm0,%xmm14,%xmm14
3407
vpxor 128-128(%rax),%xmm1,%xmm1
3408
vpsrld $27,%xmm10,%xmm9
3409
vpxor %xmm7,%xmm6,%xmm6
3410
vpxor %xmm3,%xmm1,%xmm1
3411
3412
3413
vpslld $30,%xmm11,%xmm7
3414
vpor %xmm9,%xmm8,%xmm8
3415
vpaddd %xmm6,%xmm14,%xmm14
3416
3417
vpsrld $31,%xmm1,%xmm5
3418
vpaddd %xmm1,%xmm1,%xmm1
3419
3420
vpsrld $2,%xmm11,%xmm11
3421
3422
vpaddd %xmm8,%xmm14,%xmm14
3423
vpor %xmm5,%xmm1,%xmm1
3424
vpor %xmm7,%xmm11,%xmm11
3425
vpxor %xmm4,%xmm2,%xmm2
3426
vmovdqa 48-128(%rax),%xmm4
3427
3428
vpaddd %xmm15,%xmm13,%xmm13
3429
vpslld $5,%xmm14,%xmm8
3430
vpandn %xmm12,%xmm10,%xmm7
3431
3432
vpand %xmm11,%xmm10,%xmm6
3433
3434
vmovdqa %xmm1,0-128(%rax)
3435
vpaddd %xmm1,%xmm13,%xmm13
3436
vpxor 144-128(%rax),%xmm2,%xmm2
3437
vpsrld $27,%xmm14,%xmm9
3438
vpxor %xmm7,%xmm6,%xmm6
3439
vpxor %xmm4,%xmm2,%xmm2
3440
3441
3442
vpslld $30,%xmm10,%xmm7
3443
vpor %xmm9,%xmm8,%xmm8
3444
vpaddd %xmm6,%xmm13,%xmm13
3445
3446
vpsrld $31,%xmm2,%xmm5
3447
vpaddd %xmm2,%xmm2,%xmm2
3448
3449
vpsrld $2,%xmm10,%xmm10
3450
3451
vpaddd %xmm8,%xmm13,%xmm13
3452
vpor %xmm5,%xmm2,%xmm2
3453
vpor %xmm7,%xmm10,%xmm10
3454
vpxor %xmm0,%xmm3,%xmm3
3455
vmovdqa 64-128(%rax),%xmm0
3456
3457
vpaddd %xmm15,%xmm12,%xmm12
3458
vpslld $5,%xmm13,%xmm8
3459
vpandn %xmm11,%xmm14,%xmm7
3460
3461
vpand %xmm10,%xmm14,%xmm6
3462
3463
vmovdqa %xmm2,16-128(%rax)
3464
vpaddd %xmm2,%xmm12,%xmm12
3465
vpxor 160-128(%rax),%xmm3,%xmm3
3466
vpsrld $27,%xmm13,%xmm9
3467
vpxor %xmm7,%xmm6,%xmm6
3468
vpxor %xmm0,%xmm3,%xmm3
3469
3470
3471
vpslld $30,%xmm14,%xmm7
3472
vpor %xmm9,%xmm8,%xmm8
3473
vpaddd %xmm6,%xmm12,%xmm12
3474
3475
vpsrld $31,%xmm3,%xmm5
3476
vpaddd %xmm3,%xmm3,%xmm3
3477
3478
vpsrld $2,%xmm14,%xmm14
3479
3480
vpaddd %xmm8,%xmm12,%xmm12
3481
vpor %xmm5,%xmm3,%xmm3
3482
vpor %xmm7,%xmm14,%xmm14
3483
vpxor %xmm1,%xmm4,%xmm4
3484
vmovdqa 80-128(%rax),%xmm1
3485
3486
vpaddd %xmm15,%xmm11,%xmm11
3487
vpslld $5,%xmm12,%xmm8
3488
vpandn %xmm10,%xmm13,%xmm7
3489
3490
vpand %xmm14,%xmm13,%xmm6
3491
3492
vmovdqa %xmm3,32-128(%rax)
3493
vpaddd %xmm3,%xmm11,%xmm11
3494
vpxor 176-128(%rax),%xmm4,%xmm4
3495
vpsrld $27,%xmm12,%xmm9
3496
vpxor %xmm7,%xmm6,%xmm6
3497
vpxor %xmm1,%xmm4,%xmm4
3498
3499
3500
vpslld $30,%xmm13,%xmm7
3501
vpor %xmm9,%xmm8,%xmm8
3502
vpaddd %xmm6,%xmm11,%xmm11
3503
3504
vpsrld $31,%xmm4,%xmm5
3505
vpaddd %xmm4,%xmm4,%xmm4
3506
3507
vpsrld $2,%xmm13,%xmm13
3508
3509
vpaddd %xmm8,%xmm11,%xmm11
3510
vpor %xmm5,%xmm4,%xmm4
3511
vpor %xmm7,%xmm13,%xmm13
3512
vpxor %xmm2,%xmm0,%xmm0
3513
vmovdqa 96-128(%rax),%xmm2
3514
3515
vpaddd %xmm15,%xmm10,%xmm10
3516
vpslld $5,%xmm11,%xmm8
3517
vpandn %xmm14,%xmm12,%xmm7
3518
3519
vpand %xmm13,%xmm12,%xmm6
3520
3521
vmovdqa %xmm4,48-128(%rax)
3522
vpaddd %xmm4,%xmm10,%xmm10
3523
vpxor 192-128(%rax),%xmm0,%xmm0
3524
vpsrld $27,%xmm11,%xmm9
3525
vpxor %xmm7,%xmm6,%xmm6
3526
vpxor %xmm2,%xmm0,%xmm0
3527
3528
3529
vpslld $30,%xmm12,%xmm7
3530
vpor %xmm9,%xmm8,%xmm8
3531
vpaddd %xmm6,%xmm10,%xmm10
3532
3533
vpsrld $31,%xmm0,%xmm5
3534
vpaddd %xmm0,%xmm0,%xmm0
3535
3536
vpsrld $2,%xmm12,%xmm12
3537
3538
vpaddd %xmm8,%xmm10,%xmm10
3539
vpor %xmm5,%xmm0,%xmm0
3540
vpor %xmm7,%xmm12,%xmm12
3541
vmovdqa 0(%rbp),%xmm15
3542
vpxor %xmm3,%xmm1,%xmm1
3543
vmovdqa 112-128(%rax),%xmm3
3544
3545
vpslld $5,%xmm10,%xmm8
3546
vpaddd %xmm15,%xmm14,%xmm14
3547
vpxor %xmm11,%xmm13,%xmm6
3548
vmovdqa %xmm0,64-128(%rax)
3549
vpaddd %xmm0,%xmm14,%xmm14
3550
vpxor 208-128(%rax),%xmm1,%xmm1
3551
vpsrld $27,%xmm10,%xmm9
3552
vpxor %xmm12,%xmm6,%xmm6
3553
vpxor %xmm3,%xmm1,%xmm1
3554
3555
vpslld $30,%xmm11,%xmm7
3556
vpor %xmm9,%xmm8,%xmm8
3557
vpaddd %xmm6,%xmm14,%xmm14
3558
vpsrld $31,%xmm1,%xmm5
3559
vpaddd %xmm1,%xmm1,%xmm1
3560
3561
vpsrld $2,%xmm11,%xmm11
3562
vpaddd %xmm8,%xmm14,%xmm14
3563
vpor %xmm5,%xmm1,%xmm1
3564
vpor %xmm7,%xmm11,%xmm11
3565
vpxor %xmm4,%xmm2,%xmm2
3566
vmovdqa 128-128(%rax),%xmm4
3567
3568
vpslld $5,%xmm14,%xmm8
3569
vpaddd %xmm15,%xmm13,%xmm13
3570
vpxor %xmm10,%xmm12,%xmm6
3571
vmovdqa %xmm1,80-128(%rax)
3572
vpaddd %xmm1,%xmm13,%xmm13
3573
vpxor 224-128(%rax),%xmm2,%xmm2
3574
vpsrld $27,%xmm14,%xmm9
3575
vpxor %xmm11,%xmm6,%xmm6
3576
vpxor %xmm4,%xmm2,%xmm2
3577
3578
vpslld $30,%xmm10,%xmm7
3579
vpor %xmm9,%xmm8,%xmm8
3580
vpaddd %xmm6,%xmm13,%xmm13
3581
vpsrld $31,%xmm2,%xmm5
3582
vpaddd %xmm2,%xmm2,%xmm2
3583
3584
vpsrld $2,%xmm10,%xmm10
3585
vpaddd %xmm8,%xmm13,%xmm13
3586
vpor %xmm5,%xmm2,%xmm2
3587
vpor %xmm7,%xmm10,%xmm10
3588
vpxor %xmm0,%xmm3,%xmm3
3589
vmovdqa 144-128(%rax),%xmm0
3590
3591
vpslld $5,%xmm13,%xmm8
3592
vpaddd %xmm15,%xmm12,%xmm12
3593
vpxor %xmm14,%xmm11,%xmm6
3594
vmovdqa %xmm2,96-128(%rax)
3595
vpaddd %xmm2,%xmm12,%xmm12
3596
vpxor 240-128(%rax),%xmm3,%xmm3
3597
vpsrld $27,%xmm13,%xmm9
3598
vpxor %xmm10,%xmm6,%xmm6
3599
vpxor %xmm0,%xmm3,%xmm3
3600
3601
vpslld $30,%xmm14,%xmm7
3602
vpor %xmm9,%xmm8,%xmm8
3603
vpaddd %xmm6,%xmm12,%xmm12
3604
vpsrld $31,%xmm3,%xmm5
3605
vpaddd %xmm3,%xmm3,%xmm3
3606
3607
vpsrld $2,%xmm14,%xmm14
3608
vpaddd %xmm8,%xmm12,%xmm12
3609
vpor %xmm5,%xmm3,%xmm3
3610
vpor %xmm7,%xmm14,%xmm14
3611
vpxor %xmm1,%xmm4,%xmm4
3612
vmovdqa 160-128(%rax),%xmm1
3613
3614
vpslld $5,%xmm12,%xmm8
3615
vpaddd %xmm15,%xmm11,%xmm11
3616
vpxor %xmm13,%xmm10,%xmm6
3617
vmovdqa %xmm3,112-128(%rax)
3618
vpaddd %xmm3,%xmm11,%xmm11
3619
vpxor 0-128(%rax),%xmm4,%xmm4
3620
vpsrld $27,%xmm12,%xmm9
3621
vpxor %xmm14,%xmm6,%xmm6
3622
vpxor %xmm1,%xmm4,%xmm4
3623
3624
vpslld $30,%xmm13,%xmm7
3625
vpor %xmm9,%xmm8,%xmm8
3626
vpaddd %xmm6,%xmm11,%xmm11
3627
vpsrld $31,%xmm4,%xmm5
3628
vpaddd %xmm4,%xmm4,%xmm4
3629
3630
vpsrld $2,%xmm13,%xmm13
3631
vpaddd %xmm8,%xmm11,%xmm11
3632
vpor %xmm5,%xmm4,%xmm4
3633
vpor %xmm7,%xmm13,%xmm13
3634
vpxor %xmm2,%xmm0,%xmm0
3635
vmovdqa 176-128(%rax),%xmm2
3636
3637
vpslld $5,%xmm11,%xmm8
3638
vpaddd %xmm15,%xmm10,%xmm10
3639
vpxor %xmm12,%xmm14,%xmm6
3640
vmovdqa %xmm4,128-128(%rax)
3641
vpaddd %xmm4,%xmm10,%xmm10
3642
vpxor 16-128(%rax),%xmm0,%xmm0
3643
vpsrld $27,%xmm11,%xmm9
3644
vpxor %xmm13,%xmm6,%xmm6
3645
vpxor %xmm2,%xmm0,%xmm0
3646
3647
vpslld $30,%xmm12,%xmm7
3648
vpor %xmm9,%xmm8,%xmm8
3649
vpaddd %xmm6,%xmm10,%xmm10
3650
vpsrld $31,%xmm0,%xmm5
3651
vpaddd %xmm0,%xmm0,%xmm0
3652
3653
vpsrld $2,%xmm12,%xmm12
3654
vpaddd %xmm8,%xmm10,%xmm10
3655
vpor %xmm5,%xmm0,%xmm0
3656
vpor %xmm7,%xmm12,%xmm12
3657
vpxor %xmm3,%xmm1,%xmm1
3658
vmovdqa 192-128(%rax),%xmm3
3659
3660
vpslld $5,%xmm10,%xmm8
3661
vpaddd %xmm15,%xmm14,%xmm14
3662
vpxor %xmm11,%xmm13,%xmm6
3663
vmovdqa %xmm0,144-128(%rax)
3664
vpaddd %xmm0,%xmm14,%xmm14
3665
vpxor 32-128(%rax),%xmm1,%xmm1
3666
vpsrld $27,%xmm10,%xmm9
3667
vpxor %xmm12,%xmm6,%xmm6
3668
vpxor %xmm3,%xmm1,%xmm1
3669
3670
vpslld $30,%xmm11,%xmm7
3671
vpor %xmm9,%xmm8,%xmm8
3672
vpaddd %xmm6,%xmm14,%xmm14
3673
vpsrld $31,%xmm1,%xmm5
3674
vpaddd %xmm1,%xmm1,%xmm1
3675
3676
vpsrld $2,%xmm11,%xmm11
3677
vpaddd %xmm8,%xmm14,%xmm14
3678
vpor %xmm5,%xmm1,%xmm1
3679
vpor %xmm7,%xmm11,%xmm11
3680
vpxor %xmm4,%xmm2,%xmm2
3681
vmovdqa 208-128(%rax),%xmm4
3682
3683
vpslld $5,%xmm14,%xmm8
3684
vpaddd %xmm15,%xmm13,%xmm13
3685
vpxor %xmm10,%xmm12,%xmm6
3686
vmovdqa %xmm1,160-128(%rax)
3687
vpaddd %xmm1,%xmm13,%xmm13
3688
vpxor 48-128(%rax),%xmm2,%xmm2
3689
vpsrld $27,%xmm14,%xmm9
3690
vpxor %xmm11,%xmm6,%xmm6
3691
vpxor %xmm4,%xmm2,%xmm2
3692
3693
vpslld $30,%xmm10,%xmm7
3694
vpor %xmm9,%xmm8,%xmm8
3695
vpaddd %xmm6,%xmm13,%xmm13
3696
vpsrld $31,%xmm2,%xmm5
3697
vpaddd %xmm2,%xmm2,%xmm2
3698
3699
vpsrld $2,%xmm10,%xmm10
3700
vpaddd %xmm8,%xmm13,%xmm13
3701
vpor %xmm5,%xmm2,%xmm2
3702
vpor %xmm7,%xmm10,%xmm10
3703
vpxor %xmm0,%xmm3,%xmm3
3704
vmovdqa 224-128(%rax),%xmm0
3705
3706
vpslld $5,%xmm13,%xmm8
3707
vpaddd %xmm15,%xmm12,%xmm12
3708
vpxor %xmm14,%xmm11,%xmm6
3709
vmovdqa %xmm2,176-128(%rax)
3710
vpaddd %xmm2,%xmm12,%xmm12
3711
vpxor 64-128(%rax),%xmm3,%xmm3
3712
vpsrld $27,%xmm13,%xmm9
3713
vpxor %xmm10,%xmm6,%xmm6
3714
vpxor %xmm0,%xmm3,%xmm3
3715
3716
vpslld $30,%xmm14,%xmm7
3717
vpor %xmm9,%xmm8,%xmm8
3718
vpaddd %xmm6,%xmm12,%xmm12
3719
vpsrld $31,%xmm3,%xmm5
3720
vpaddd %xmm3,%xmm3,%xmm3
3721
3722
vpsrld $2,%xmm14,%xmm14
3723
vpaddd %xmm8,%xmm12,%xmm12
3724
vpor %xmm5,%xmm3,%xmm3
3725
vpor %xmm7,%xmm14,%xmm14
3726
vpxor %xmm1,%xmm4,%xmm4
3727
vmovdqa 240-128(%rax),%xmm1
3728
3729
vpslld $5,%xmm12,%xmm8
3730
vpaddd %xmm15,%xmm11,%xmm11
3731
vpxor %xmm13,%xmm10,%xmm6
3732
vmovdqa %xmm3,192-128(%rax)
3733
vpaddd %xmm3,%xmm11,%xmm11
3734
vpxor 80-128(%rax),%xmm4,%xmm4
3735
vpsrld $27,%xmm12,%xmm9
3736
vpxor %xmm14,%xmm6,%xmm6
3737
vpxor %xmm1,%xmm4,%xmm4
3738
3739
vpslld $30,%xmm13,%xmm7
3740
vpor %xmm9,%xmm8,%xmm8
3741
vpaddd %xmm6,%xmm11,%xmm11
3742
vpsrld $31,%xmm4,%xmm5
3743
vpaddd %xmm4,%xmm4,%xmm4
3744
3745
vpsrld $2,%xmm13,%xmm13
3746
vpaddd %xmm8,%xmm11,%xmm11
3747
vpor %xmm5,%xmm4,%xmm4
3748
vpor %xmm7,%xmm13,%xmm13
3749
vpxor %xmm2,%xmm0,%xmm0
3750
vmovdqa 0-128(%rax),%xmm2
3751
3752
vpslld $5,%xmm11,%xmm8
3753
vpaddd %xmm15,%xmm10,%xmm10
3754
vpxor %xmm12,%xmm14,%xmm6
3755
vmovdqa %xmm4,208-128(%rax)
3756
vpaddd %xmm4,%xmm10,%xmm10
3757
vpxor 96-128(%rax),%xmm0,%xmm0
3758
vpsrld $27,%xmm11,%xmm9
3759
vpxor %xmm13,%xmm6,%xmm6
3760
vpxor %xmm2,%xmm0,%xmm0
3761
3762
vpslld $30,%xmm12,%xmm7
3763
vpor %xmm9,%xmm8,%xmm8
3764
vpaddd %xmm6,%xmm10,%xmm10
3765
vpsrld $31,%xmm0,%xmm5
3766
vpaddd %xmm0,%xmm0,%xmm0
3767
3768
vpsrld $2,%xmm12,%xmm12
3769
vpaddd %xmm8,%xmm10,%xmm10
3770
vpor %xmm5,%xmm0,%xmm0
3771
vpor %xmm7,%xmm12,%xmm12
3772
vpxor %xmm3,%xmm1,%xmm1
3773
vmovdqa 16-128(%rax),%xmm3
3774
3775
vpslld $5,%xmm10,%xmm8
3776
vpaddd %xmm15,%xmm14,%xmm14
3777
vpxor %xmm11,%xmm13,%xmm6
3778
vmovdqa %xmm0,224-128(%rax)
3779
vpaddd %xmm0,%xmm14,%xmm14
3780
vpxor 112-128(%rax),%xmm1,%xmm1
3781
vpsrld $27,%xmm10,%xmm9
3782
vpxor %xmm12,%xmm6,%xmm6
3783
vpxor %xmm3,%xmm1,%xmm1
3784
3785
vpslld $30,%xmm11,%xmm7
3786
vpor %xmm9,%xmm8,%xmm8
3787
vpaddd %xmm6,%xmm14,%xmm14
3788
vpsrld $31,%xmm1,%xmm5
3789
vpaddd %xmm1,%xmm1,%xmm1
3790
3791
vpsrld $2,%xmm11,%xmm11
3792
vpaddd %xmm8,%xmm14,%xmm14
3793
vpor %xmm5,%xmm1,%xmm1
3794
vpor %xmm7,%xmm11,%xmm11
3795
vpxor %xmm4,%xmm2,%xmm2
3796
vmovdqa 32-128(%rax),%xmm4
3797
3798
vpslld $5,%xmm14,%xmm8
3799
vpaddd %xmm15,%xmm13,%xmm13
3800
vpxor %xmm10,%xmm12,%xmm6
3801
vmovdqa %xmm1,240-128(%rax)
3802
vpaddd %xmm1,%xmm13,%xmm13
3803
vpxor 128-128(%rax),%xmm2,%xmm2
3804
vpsrld $27,%xmm14,%xmm9
3805
vpxor %xmm11,%xmm6,%xmm6
3806
vpxor %xmm4,%xmm2,%xmm2
3807
3808
vpslld $30,%xmm10,%xmm7
3809
vpor %xmm9,%xmm8,%xmm8
3810
vpaddd %xmm6,%xmm13,%xmm13
3811
vpsrld $31,%xmm2,%xmm5
3812
vpaddd %xmm2,%xmm2,%xmm2
3813
3814
vpsrld $2,%xmm10,%xmm10
3815
vpaddd %xmm8,%xmm13,%xmm13
3816
vpor %xmm5,%xmm2,%xmm2
3817
vpor %xmm7,%xmm10,%xmm10
3818
vpxor %xmm0,%xmm3,%xmm3
3819
vmovdqa 48-128(%rax),%xmm0
3820
3821
vpslld $5,%xmm13,%xmm8
3822
vpaddd %xmm15,%xmm12,%xmm12
3823
vpxor %xmm14,%xmm11,%xmm6
3824
vmovdqa %xmm2,0-128(%rax)
3825
vpaddd %xmm2,%xmm12,%xmm12
3826
vpxor 144-128(%rax),%xmm3,%xmm3
3827
vpsrld $27,%xmm13,%xmm9
3828
vpxor %xmm10,%xmm6,%xmm6
3829
vpxor %xmm0,%xmm3,%xmm3
3830
3831
vpslld $30,%xmm14,%xmm7
3832
vpor %xmm9,%xmm8,%xmm8
3833
vpaddd %xmm6,%xmm12,%xmm12
3834
vpsrld $31,%xmm3,%xmm5
3835
vpaddd %xmm3,%xmm3,%xmm3
3836
3837
vpsrld $2,%xmm14,%xmm14
3838
vpaddd %xmm8,%xmm12,%xmm12
3839
vpor %xmm5,%xmm3,%xmm3
3840
vpor %xmm7,%xmm14,%xmm14
3841
vpxor %xmm1,%xmm4,%xmm4
3842
vmovdqa 64-128(%rax),%xmm1
3843
3844
vpslld $5,%xmm12,%xmm8
3845
vpaddd %xmm15,%xmm11,%xmm11
3846
vpxor %xmm13,%xmm10,%xmm6
3847
vmovdqa %xmm3,16-128(%rax)
3848
vpaddd %xmm3,%xmm11,%xmm11
3849
vpxor 160-128(%rax),%xmm4,%xmm4
3850
vpsrld $27,%xmm12,%xmm9
3851
vpxor %xmm14,%xmm6,%xmm6
3852
vpxor %xmm1,%xmm4,%xmm4
3853
3854
vpslld $30,%xmm13,%xmm7
3855
vpor %xmm9,%xmm8,%xmm8
3856
vpaddd %xmm6,%xmm11,%xmm11
3857
vpsrld $31,%xmm4,%xmm5
3858
vpaddd %xmm4,%xmm4,%xmm4
3859
3860
vpsrld $2,%xmm13,%xmm13
3861
vpaddd %xmm8,%xmm11,%xmm11
3862
vpor %xmm5,%xmm4,%xmm4
3863
vpor %xmm7,%xmm13,%xmm13
3864
vpxor %xmm2,%xmm0,%xmm0
3865
vmovdqa 80-128(%rax),%xmm2
3866
3867
vpslld $5,%xmm11,%xmm8
3868
vpaddd %xmm15,%xmm10,%xmm10
3869
vpxor %xmm12,%xmm14,%xmm6
3870
vmovdqa %xmm4,32-128(%rax)
3871
vpaddd %xmm4,%xmm10,%xmm10
3872
vpxor 176-128(%rax),%xmm0,%xmm0
3873
vpsrld $27,%xmm11,%xmm9
3874
vpxor %xmm13,%xmm6,%xmm6
3875
vpxor %xmm2,%xmm0,%xmm0
3876
3877
vpslld $30,%xmm12,%xmm7
3878
vpor %xmm9,%xmm8,%xmm8
3879
vpaddd %xmm6,%xmm10,%xmm10
3880
vpsrld $31,%xmm0,%xmm5
3881
vpaddd %xmm0,%xmm0,%xmm0
3882
3883
vpsrld $2,%xmm12,%xmm12
3884
vpaddd %xmm8,%xmm10,%xmm10
3885
vpor %xmm5,%xmm0,%xmm0
3886
vpor %xmm7,%xmm12,%xmm12
3887
vpxor %xmm3,%xmm1,%xmm1
3888
vmovdqa 96-128(%rax),%xmm3
3889
3890
vpslld $5,%xmm10,%xmm8
3891
vpaddd %xmm15,%xmm14,%xmm14
3892
vpxor %xmm11,%xmm13,%xmm6
3893
vmovdqa %xmm0,48-128(%rax)
3894
vpaddd %xmm0,%xmm14,%xmm14
3895
vpxor 192-128(%rax),%xmm1,%xmm1
3896
vpsrld $27,%xmm10,%xmm9
3897
vpxor %xmm12,%xmm6,%xmm6
3898
vpxor %xmm3,%xmm1,%xmm1
3899
3900
vpslld $30,%xmm11,%xmm7
3901
vpor %xmm9,%xmm8,%xmm8
3902
vpaddd %xmm6,%xmm14,%xmm14
3903
vpsrld $31,%xmm1,%xmm5
3904
vpaddd %xmm1,%xmm1,%xmm1
3905
3906
vpsrld $2,%xmm11,%xmm11
3907
vpaddd %xmm8,%xmm14,%xmm14
3908
vpor %xmm5,%xmm1,%xmm1
3909
vpor %xmm7,%xmm11,%xmm11
3910
vpxor %xmm4,%xmm2,%xmm2
3911
vmovdqa 112-128(%rax),%xmm4
3912
3913
vpslld $5,%xmm14,%xmm8
3914
vpaddd %xmm15,%xmm13,%xmm13
3915
vpxor %xmm10,%xmm12,%xmm6
3916
vmovdqa %xmm1,64-128(%rax)
3917
vpaddd %xmm1,%xmm13,%xmm13
3918
vpxor 208-128(%rax),%xmm2,%xmm2
3919
vpsrld $27,%xmm14,%xmm9
3920
vpxor %xmm11,%xmm6,%xmm6
3921
vpxor %xmm4,%xmm2,%xmm2
3922
3923
vpslld $30,%xmm10,%xmm7
3924
vpor %xmm9,%xmm8,%xmm8
3925
vpaddd %xmm6,%xmm13,%xmm13
3926
vpsrld $31,%xmm2,%xmm5
3927
vpaddd %xmm2,%xmm2,%xmm2
3928
3929
vpsrld $2,%xmm10,%xmm10
3930
vpaddd %xmm8,%xmm13,%xmm13
3931
vpor %xmm5,%xmm2,%xmm2
3932
vpor %xmm7,%xmm10,%xmm10
3933
vpxor %xmm0,%xmm3,%xmm3
3934
vmovdqa 128-128(%rax),%xmm0
3935
3936
vpslld $5,%xmm13,%xmm8
3937
vpaddd %xmm15,%xmm12,%xmm12
3938
vpxor %xmm14,%xmm11,%xmm6
3939
vmovdqa %xmm2,80-128(%rax)
3940
vpaddd %xmm2,%xmm12,%xmm12
3941
vpxor 224-128(%rax),%xmm3,%xmm3
3942
vpsrld $27,%xmm13,%xmm9
3943
vpxor %xmm10,%xmm6,%xmm6
3944
vpxor %xmm0,%xmm3,%xmm3
3945
3946
vpslld $30,%xmm14,%xmm7
3947
vpor %xmm9,%xmm8,%xmm8
3948
vpaddd %xmm6,%xmm12,%xmm12
3949
vpsrld $31,%xmm3,%xmm5
3950
vpaddd %xmm3,%xmm3,%xmm3
3951
3952
vpsrld $2,%xmm14,%xmm14
3953
vpaddd %xmm8,%xmm12,%xmm12
3954
vpor %xmm5,%xmm3,%xmm3
3955
vpor %xmm7,%xmm14,%xmm14
3956
vpxor %xmm1,%xmm4,%xmm4
3957
vmovdqa 144-128(%rax),%xmm1
3958
3959
vpslld $5,%xmm12,%xmm8
3960
vpaddd %xmm15,%xmm11,%xmm11
3961
vpxor %xmm13,%xmm10,%xmm6
3962
vmovdqa %xmm3,96-128(%rax)
3963
vpaddd %xmm3,%xmm11,%xmm11
3964
vpxor 240-128(%rax),%xmm4,%xmm4
3965
vpsrld $27,%xmm12,%xmm9
3966
vpxor %xmm14,%xmm6,%xmm6
3967
vpxor %xmm1,%xmm4,%xmm4
3968
3969
vpslld $30,%xmm13,%xmm7
3970
vpor %xmm9,%xmm8,%xmm8
3971
vpaddd %xmm6,%xmm11,%xmm11
3972
vpsrld $31,%xmm4,%xmm5
3973
vpaddd %xmm4,%xmm4,%xmm4
3974
3975
vpsrld $2,%xmm13,%xmm13
3976
vpaddd %xmm8,%xmm11,%xmm11
3977
vpor %xmm5,%xmm4,%xmm4
3978
vpor %xmm7,%xmm13,%xmm13
3979
vpxor %xmm2,%xmm0,%xmm0
3980
vmovdqa 160-128(%rax),%xmm2
3981
3982
vpslld $5,%xmm11,%xmm8
3983
vpaddd %xmm15,%xmm10,%xmm10
3984
vpxor %xmm12,%xmm14,%xmm6
3985
vmovdqa %xmm4,112-128(%rax)
3986
vpaddd %xmm4,%xmm10,%xmm10
3987
vpxor 0-128(%rax),%xmm0,%xmm0
3988
vpsrld $27,%xmm11,%xmm9
3989
vpxor %xmm13,%xmm6,%xmm6
3990
vpxor %xmm2,%xmm0,%xmm0
3991
3992
vpslld $30,%xmm12,%xmm7
3993
vpor %xmm9,%xmm8,%xmm8
3994
vpaddd %xmm6,%xmm10,%xmm10
3995
vpsrld $31,%xmm0,%xmm5
3996
vpaddd %xmm0,%xmm0,%xmm0
3997
3998
vpsrld $2,%xmm12,%xmm12
3999
vpaddd %xmm8,%xmm10,%xmm10
4000
vpor %xmm5,%xmm0,%xmm0
4001
vpor %xmm7,%xmm12,%xmm12
4002
vmovdqa 32(%rbp),%xmm15
4003
vpxor %xmm3,%xmm1,%xmm1
4004
vmovdqa 176-128(%rax),%xmm3
4005
4006
vpaddd %xmm15,%xmm14,%xmm14
4007
vpslld $5,%xmm10,%xmm8
4008
vpand %xmm12,%xmm13,%xmm7
4009
vpxor 16-128(%rax),%xmm1,%xmm1
4010
4011
vpaddd %xmm7,%xmm14,%xmm14
4012
vpsrld $27,%xmm10,%xmm9
4013
vpxor %xmm12,%xmm13,%xmm6
4014
vpxor %xmm3,%xmm1,%xmm1
4015
4016
vmovdqu %xmm0,128-128(%rax)
4017
vpaddd %xmm0,%xmm14,%xmm14
4018
vpor %xmm9,%xmm8,%xmm8
4019
vpsrld $31,%xmm1,%xmm5
4020
vpand %xmm11,%xmm6,%xmm6
4021
vpaddd %xmm1,%xmm1,%xmm1
4022
4023
vpslld $30,%xmm11,%xmm7
4024
vpaddd %xmm6,%xmm14,%xmm14
4025
4026
vpsrld $2,%xmm11,%xmm11
4027
vpaddd %xmm8,%xmm14,%xmm14
4028
vpor %xmm5,%xmm1,%xmm1
4029
vpor %xmm7,%xmm11,%xmm11
4030
vpxor %xmm4,%xmm2,%xmm2
4031
vmovdqa 192-128(%rax),%xmm4
4032
4033
vpaddd %xmm15,%xmm13,%xmm13
4034
vpslld $5,%xmm14,%xmm8
4035
vpand %xmm11,%xmm12,%xmm7
4036
vpxor 32-128(%rax),%xmm2,%xmm2
4037
4038
vpaddd %xmm7,%xmm13,%xmm13
4039
vpsrld $27,%xmm14,%xmm9
4040
vpxor %xmm11,%xmm12,%xmm6
4041
vpxor %xmm4,%xmm2,%xmm2
4042
4043
vmovdqu %xmm1,144-128(%rax)
4044
vpaddd %xmm1,%xmm13,%xmm13
4045
vpor %xmm9,%xmm8,%xmm8
4046
vpsrld $31,%xmm2,%xmm5
4047
vpand %xmm10,%xmm6,%xmm6
4048
vpaddd %xmm2,%xmm2,%xmm2
4049
4050
vpslld $30,%xmm10,%xmm7
4051
vpaddd %xmm6,%xmm13,%xmm13
4052
4053
vpsrld $2,%xmm10,%xmm10
4054
vpaddd %xmm8,%xmm13,%xmm13
4055
vpor %xmm5,%xmm2,%xmm2
4056
vpor %xmm7,%xmm10,%xmm10
4057
vpxor %xmm0,%xmm3,%xmm3
4058
vmovdqa 208-128(%rax),%xmm0
4059
4060
vpaddd %xmm15,%xmm12,%xmm12
4061
vpslld $5,%xmm13,%xmm8
4062
vpand %xmm10,%xmm11,%xmm7
4063
vpxor 48-128(%rax),%xmm3,%xmm3
4064
4065
vpaddd %xmm7,%xmm12,%xmm12
4066
vpsrld $27,%xmm13,%xmm9
4067
vpxor %xmm10,%xmm11,%xmm6
4068
vpxor %xmm0,%xmm3,%xmm3
4069
4070
vmovdqu %xmm2,160-128(%rax)
4071
vpaddd %xmm2,%xmm12,%xmm12
4072
vpor %xmm9,%xmm8,%xmm8
4073
vpsrld $31,%xmm3,%xmm5
4074
vpand %xmm14,%xmm6,%xmm6
4075
vpaddd %xmm3,%xmm3,%xmm3
4076
4077
vpslld $30,%xmm14,%xmm7
4078
vpaddd %xmm6,%xmm12,%xmm12
4079
4080
vpsrld $2,%xmm14,%xmm14
4081
vpaddd %xmm8,%xmm12,%xmm12
4082
vpor %xmm5,%xmm3,%xmm3
4083
vpor %xmm7,%xmm14,%xmm14
4084
vpxor %xmm1,%xmm4,%xmm4
4085
vmovdqa 224-128(%rax),%xmm1
4086
4087
vpaddd %xmm15,%xmm11,%xmm11
4088
vpslld $5,%xmm12,%xmm8
4089
vpand %xmm14,%xmm10,%xmm7
4090
vpxor 64-128(%rax),%xmm4,%xmm4
4091
4092
vpaddd %xmm7,%xmm11,%xmm11
4093
vpsrld $27,%xmm12,%xmm9
4094
vpxor %xmm14,%xmm10,%xmm6
4095
vpxor %xmm1,%xmm4,%xmm4
4096
4097
vmovdqu %xmm3,176-128(%rax)
4098
vpaddd %xmm3,%xmm11,%xmm11
4099
vpor %xmm9,%xmm8,%xmm8
4100
vpsrld $31,%xmm4,%xmm5
4101
vpand %xmm13,%xmm6,%xmm6
4102
vpaddd %xmm4,%xmm4,%xmm4
4103
4104
vpslld $30,%xmm13,%xmm7
4105
vpaddd %xmm6,%xmm11,%xmm11
4106
4107
vpsrld $2,%xmm13,%xmm13
4108
vpaddd %xmm8,%xmm11,%xmm11
4109
vpor %xmm5,%xmm4,%xmm4
4110
vpor %xmm7,%xmm13,%xmm13
4111
vpxor %xmm2,%xmm0,%xmm0
4112
vmovdqa 240-128(%rax),%xmm2
4113
4114
vpaddd %xmm15,%xmm10,%xmm10
4115
vpslld $5,%xmm11,%xmm8
4116
vpand %xmm13,%xmm14,%xmm7
4117
vpxor 80-128(%rax),%xmm0,%xmm0
4118
4119
vpaddd %xmm7,%xmm10,%xmm10
4120
vpsrld $27,%xmm11,%xmm9
4121
vpxor %xmm13,%xmm14,%xmm6
4122
vpxor %xmm2,%xmm0,%xmm0
4123
4124
vmovdqu %xmm4,192-128(%rax)
4125
vpaddd %xmm4,%xmm10,%xmm10
4126
vpor %xmm9,%xmm8,%xmm8
4127
vpsrld $31,%xmm0,%xmm5
4128
vpand %xmm12,%xmm6,%xmm6
4129
vpaddd %xmm0,%xmm0,%xmm0
4130
4131
vpslld $30,%xmm12,%xmm7
4132
vpaddd %xmm6,%xmm10,%xmm10
4133
4134
vpsrld $2,%xmm12,%xmm12
4135
vpaddd %xmm8,%xmm10,%xmm10
4136
vpor %xmm5,%xmm0,%xmm0
4137
vpor %xmm7,%xmm12,%xmm12
4138
vpxor %xmm3,%xmm1,%xmm1
4139
vmovdqa 0-128(%rax),%xmm3
4140
4141
vpaddd %xmm15,%xmm14,%xmm14
4142
vpslld $5,%xmm10,%xmm8
4143
vpand %xmm12,%xmm13,%xmm7
4144
vpxor 96-128(%rax),%xmm1,%xmm1
4145
4146
vpaddd %xmm7,%xmm14,%xmm14
4147
vpsrld $27,%xmm10,%xmm9
4148
vpxor %xmm12,%xmm13,%xmm6
4149
vpxor %xmm3,%xmm1,%xmm1
4150
4151
vmovdqu %xmm0,208-128(%rax)
4152
vpaddd %xmm0,%xmm14,%xmm14
4153
vpor %xmm9,%xmm8,%xmm8
4154
vpsrld $31,%xmm1,%xmm5
4155
vpand %xmm11,%xmm6,%xmm6
4156
vpaddd %xmm1,%xmm1,%xmm1
4157
4158
vpslld $30,%xmm11,%xmm7
4159
vpaddd %xmm6,%xmm14,%xmm14
4160
4161
vpsrld $2,%xmm11,%xmm11
4162
vpaddd %xmm8,%xmm14,%xmm14
4163
vpor %xmm5,%xmm1,%xmm1
4164
vpor %xmm7,%xmm11,%xmm11
4165
vpxor %xmm4,%xmm2,%xmm2
4166
vmovdqa 16-128(%rax),%xmm4
4167
4168
vpaddd %xmm15,%xmm13,%xmm13
4169
vpslld $5,%xmm14,%xmm8
4170
vpand %xmm11,%xmm12,%xmm7
4171
vpxor 112-128(%rax),%xmm2,%xmm2
4172
4173
vpaddd %xmm7,%xmm13,%xmm13
4174
vpsrld $27,%xmm14,%xmm9
4175
vpxor %xmm11,%xmm12,%xmm6
4176
vpxor %xmm4,%xmm2,%xmm2
4177
4178
vmovdqu %xmm1,224-128(%rax)
4179
vpaddd %xmm1,%xmm13,%xmm13
4180
vpor %xmm9,%xmm8,%xmm8
4181
vpsrld $31,%xmm2,%xmm5
4182
vpand %xmm10,%xmm6,%xmm6
4183
vpaddd %xmm2,%xmm2,%xmm2
4184
4185
vpslld $30,%xmm10,%xmm7
4186
vpaddd %xmm6,%xmm13,%xmm13
4187
4188
vpsrld $2,%xmm10,%xmm10
4189
vpaddd %xmm8,%xmm13,%xmm13
4190
vpor %xmm5,%xmm2,%xmm2
4191
vpor %xmm7,%xmm10,%xmm10
4192
vpxor %xmm0,%xmm3,%xmm3
4193
vmovdqa 32-128(%rax),%xmm0
4194
4195
vpaddd %xmm15,%xmm12,%xmm12
4196
vpslld $5,%xmm13,%xmm8
4197
vpand %xmm10,%xmm11,%xmm7
4198
vpxor 128-128(%rax),%xmm3,%xmm3
4199
4200
vpaddd %xmm7,%xmm12,%xmm12
4201
vpsrld $27,%xmm13,%xmm9
4202
vpxor %xmm10,%xmm11,%xmm6
4203
vpxor %xmm0,%xmm3,%xmm3
4204
4205
vmovdqu %xmm2,240-128(%rax)
4206
vpaddd %xmm2,%xmm12,%xmm12
4207
vpor %xmm9,%xmm8,%xmm8
4208
vpsrld $31,%xmm3,%xmm5
4209
vpand %xmm14,%xmm6,%xmm6
4210
vpaddd %xmm3,%xmm3,%xmm3
4211
4212
vpslld $30,%xmm14,%xmm7
4213
vpaddd %xmm6,%xmm12,%xmm12
4214
4215
vpsrld $2,%xmm14,%xmm14
4216
vpaddd %xmm8,%xmm12,%xmm12
4217
vpor %xmm5,%xmm3,%xmm3
4218
vpor %xmm7,%xmm14,%xmm14
4219
vpxor %xmm1,%xmm4,%xmm4
4220
vmovdqa 48-128(%rax),%xmm1
4221
4222
vpaddd %xmm15,%xmm11,%xmm11
4223
vpslld $5,%xmm12,%xmm8
4224
vpand %xmm14,%xmm10,%xmm7
4225
vpxor 144-128(%rax),%xmm4,%xmm4
4226
4227
vpaddd %xmm7,%xmm11,%xmm11
4228
vpsrld $27,%xmm12,%xmm9
4229
vpxor %xmm14,%xmm10,%xmm6
4230
vpxor %xmm1,%xmm4,%xmm4
4231
4232
vmovdqu %xmm3,0-128(%rax)
4233
vpaddd %xmm3,%xmm11,%xmm11
4234
vpor %xmm9,%xmm8,%xmm8
4235
vpsrld $31,%xmm4,%xmm5
4236
vpand %xmm13,%xmm6,%xmm6
4237
vpaddd %xmm4,%xmm4,%xmm4
4238
4239
vpslld $30,%xmm13,%xmm7
4240
vpaddd %xmm6,%xmm11,%xmm11
4241
4242
vpsrld $2,%xmm13,%xmm13
4243
vpaddd %xmm8,%xmm11,%xmm11
4244
vpor %xmm5,%xmm4,%xmm4
4245
vpor %xmm7,%xmm13,%xmm13
4246
vpxor %xmm2,%xmm0,%xmm0
4247
vmovdqa 64-128(%rax),%xmm2
4248
4249
vpaddd %xmm15,%xmm10,%xmm10
4250
vpslld $5,%xmm11,%xmm8
4251
vpand %xmm13,%xmm14,%xmm7
4252
vpxor 160-128(%rax),%xmm0,%xmm0
4253
4254
vpaddd %xmm7,%xmm10,%xmm10
4255
vpsrld $27,%xmm11,%xmm9
4256
vpxor %xmm13,%xmm14,%xmm6
4257
vpxor %xmm2,%xmm0,%xmm0
4258
4259
vmovdqu %xmm4,16-128(%rax)
4260
vpaddd %xmm4,%xmm10,%xmm10
4261
vpor %xmm9,%xmm8,%xmm8
4262
vpsrld $31,%xmm0,%xmm5
4263
vpand %xmm12,%xmm6,%xmm6
4264
vpaddd %xmm0,%xmm0,%xmm0
4265
4266
vpslld $30,%xmm12,%xmm7
4267
vpaddd %xmm6,%xmm10,%xmm10
4268
4269
vpsrld $2,%xmm12,%xmm12
4270
vpaddd %xmm8,%xmm10,%xmm10
4271
vpor %xmm5,%xmm0,%xmm0
4272
vpor %xmm7,%xmm12,%xmm12
4273
vpxor %xmm3,%xmm1,%xmm1
4274
vmovdqa 80-128(%rax),%xmm3
4275
4276
vpaddd %xmm15,%xmm14,%xmm14
4277
vpslld $5,%xmm10,%xmm8
4278
vpand %xmm12,%xmm13,%xmm7
4279
vpxor 176-128(%rax),%xmm1,%xmm1
4280
4281
vpaddd %xmm7,%xmm14,%xmm14
4282
vpsrld $27,%xmm10,%xmm9
4283
vpxor %xmm12,%xmm13,%xmm6
4284
vpxor %xmm3,%xmm1,%xmm1
4285
4286
vmovdqu %xmm0,32-128(%rax)
4287
vpaddd %xmm0,%xmm14,%xmm14
4288
vpor %xmm9,%xmm8,%xmm8
4289
vpsrld $31,%xmm1,%xmm5
4290
vpand %xmm11,%xmm6,%xmm6
4291
vpaddd %xmm1,%xmm1,%xmm1
4292
4293
vpslld $30,%xmm11,%xmm7
4294
vpaddd %xmm6,%xmm14,%xmm14
4295
4296
vpsrld $2,%xmm11,%xmm11
4297
vpaddd %xmm8,%xmm14,%xmm14
4298
vpor %xmm5,%xmm1,%xmm1
4299
vpor %xmm7,%xmm11,%xmm11
4300
vpxor %xmm4,%xmm2,%xmm2
4301
vmovdqa 96-128(%rax),%xmm4
4302
4303
vpaddd %xmm15,%xmm13,%xmm13
4304
vpslld $5,%xmm14,%xmm8
4305
vpand %xmm11,%xmm12,%xmm7
4306
vpxor 192-128(%rax),%xmm2,%xmm2
4307
4308
vpaddd %xmm7,%xmm13,%xmm13
4309
vpsrld $27,%xmm14,%xmm9
4310
vpxor %xmm11,%xmm12,%xmm6
4311
vpxor %xmm4,%xmm2,%xmm2
4312
4313
vmovdqu %xmm1,48-128(%rax)
4314
vpaddd %xmm1,%xmm13,%xmm13
4315
vpor %xmm9,%xmm8,%xmm8
4316
vpsrld $31,%xmm2,%xmm5
4317
vpand %xmm10,%xmm6,%xmm6
4318
vpaddd %xmm2,%xmm2,%xmm2
4319
4320
vpslld $30,%xmm10,%xmm7
4321
vpaddd %xmm6,%xmm13,%xmm13
4322
4323
vpsrld $2,%xmm10,%xmm10
4324
vpaddd %xmm8,%xmm13,%xmm13
4325
vpor %xmm5,%xmm2,%xmm2
4326
vpor %xmm7,%xmm10,%xmm10
4327
vpxor %xmm0,%xmm3,%xmm3
4328
vmovdqa 112-128(%rax),%xmm0
4329
4330
vpaddd %xmm15,%xmm12,%xmm12
4331
vpslld $5,%xmm13,%xmm8
4332
vpand %xmm10,%xmm11,%xmm7
4333
vpxor 208-128(%rax),%xmm3,%xmm3
4334
4335
vpaddd %xmm7,%xmm12,%xmm12
4336
vpsrld $27,%xmm13,%xmm9
4337
vpxor %xmm10,%xmm11,%xmm6
4338
vpxor %xmm0,%xmm3,%xmm3
4339
4340
vmovdqu %xmm2,64-128(%rax)
4341
vpaddd %xmm2,%xmm12,%xmm12
4342
vpor %xmm9,%xmm8,%xmm8
4343
vpsrld $31,%xmm3,%xmm5
4344
vpand %xmm14,%xmm6,%xmm6
4345
vpaddd %xmm3,%xmm3,%xmm3
4346
4347
vpslld $30,%xmm14,%xmm7
4348
vpaddd %xmm6,%xmm12,%xmm12
4349
4350
vpsrld $2,%xmm14,%xmm14
4351
vpaddd %xmm8,%xmm12,%xmm12
4352
vpor %xmm5,%xmm3,%xmm3
4353
vpor %xmm7,%xmm14,%xmm14
4354
vpxor %xmm1,%xmm4,%xmm4
4355
vmovdqa 128-128(%rax),%xmm1
4356
4357
vpaddd %xmm15,%xmm11,%xmm11
4358
vpslld $5,%xmm12,%xmm8
4359
vpand %xmm14,%xmm10,%xmm7
4360
vpxor 224-128(%rax),%xmm4,%xmm4
4361
4362
vpaddd %xmm7,%xmm11,%xmm11
4363
vpsrld $27,%xmm12,%xmm9
4364
vpxor %xmm14,%xmm10,%xmm6
4365
vpxor %xmm1,%xmm4,%xmm4
4366
4367
vmovdqu %xmm3,80-128(%rax)
4368
vpaddd %xmm3,%xmm11,%xmm11
4369
vpor %xmm9,%xmm8,%xmm8
4370
vpsrld $31,%xmm4,%xmm5
4371
vpand %xmm13,%xmm6,%xmm6
4372
vpaddd %xmm4,%xmm4,%xmm4
4373
4374
vpslld $30,%xmm13,%xmm7
4375
vpaddd %xmm6,%xmm11,%xmm11
4376
4377
vpsrld $2,%xmm13,%xmm13
4378
vpaddd %xmm8,%xmm11,%xmm11
4379
vpor %xmm5,%xmm4,%xmm4
4380
vpor %xmm7,%xmm13,%xmm13
4381
vpxor %xmm2,%xmm0,%xmm0
4382
vmovdqa 144-128(%rax),%xmm2
4383
4384
vpaddd %xmm15,%xmm10,%xmm10
4385
vpslld $5,%xmm11,%xmm8
4386
vpand %xmm13,%xmm14,%xmm7
4387
vpxor 240-128(%rax),%xmm0,%xmm0
4388
4389
vpaddd %xmm7,%xmm10,%xmm10
4390
vpsrld $27,%xmm11,%xmm9
4391
vpxor %xmm13,%xmm14,%xmm6
4392
vpxor %xmm2,%xmm0,%xmm0
4393
4394
vmovdqu %xmm4,96-128(%rax)
4395
vpaddd %xmm4,%xmm10,%xmm10
4396
vpor %xmm9,%xmm8,%xmm8
4397
vpsrld $31,%xmm0,%xmm5
4398
vpand %xmm12,%xmm6,%xmm6
4399
vpaddd %xmm0,%xmm0,%xmm0
4400
4401
vpslld $30,%xmm12,%xmm7
4402
vpaddd %xmm6,%xmm10,%xmm10
4403
4404
vpsrld $2,%xmm12,%xmm12
4405
vpaddd %xmm8,%xmm10,%xmm10
4406
vpor %xmm5,%xmm0,%xmm0
4407
vpor %xmm7,%xmm12,%xmm12
4408
vpxor %xmm3,%xmm1,%xmm1
4409
vmovdqa 160-128(%rax),%xmm3
4410
4411
vpaddd %xmm15,%xmm14,%xmm14
4412
vpslld $5,%xmm10,%xmm8
4413
vpand %xmm12,%xmm13,%xmm7
4414
vpxor 0-128(%rax),%xmm1,%xmm1
4415
4416
vpaddd %xmm7,%xmm14,%xmm14
4417
vpsrld $27,%xmm10,%xmm9
4418
vpxor %xmm12,%xmm13,%xmm6
4419
vpxor %xmm3,%xmm1,%xmm1
4420
4421
vmovdqu %xmm0,112-128(%rax)
4422
vpaddd %xmm0,%xmm14,%xmm14
4423
vpor %xmm9,%xmm8,%xmm8
4424
vpsrld $31,%xmm1,%xmm5
4425
vpand %xmm11,%xmm6,%xmm6
4426
vpaddd %xmm1,%xmm1,%xmm1
4427
4428
vpslld $30,%xmm11,%xmm7
4429
vpaddd %xmm6,%xmm14,%xmm14
4430
4431
vpsrld $2,%xmm11,%xmm11
4432
vpaddd %xmm8,%xmm14,%xmm14
4433
vpor %xmm5,%xmm1,%xmm1
4434
vpor %xmm7,%xmm11,%xmm11
4435
vpxor %xmm4,%xmm2,%xmm2
4436
vmovdqa 176-128(%rax),%xmm4
4437
4438
vpaddd %xmm15,%xmm13,%xmm13
4439
vpslld $5,%xmm14,%xmm8
4440
vpand %xmm11,%xmm12,%xmm7
4441
vpxor 16-128(%rax),%xmm2,%xmm2
4442
4443
vpaddd %xmm7,%xmm13,%xmm13
4444
vpsrld $27,%xmm14,%xmm9
4445
vpxor %xmm11,%xmm12,%xmm6
4446
vpxor %xmm4,%xmm2,%xmm2
4447
4448
vmovdqu %xmm1,128-128(%rax)
4449
vpaddd %xmm1,%xmm13,%xmm13
4450
vpor %xmm9,%xmm8,%xmm8
4451
vpsrld $31,%xmm2,%xmm5
4452
vpand %xmm10,%xmm6,%xmm6
4453
vpaddd %xmm2,%xmm2,%xmm2
4454
4455
vpslld $30,%xmm10,%xmm7
4456
vpaddd %xmm6,%xmm13,%xmm13
4457
4458
vpsrld $2,%xmm10,%xmm10
4459
vpaddd %xmm8,%xmm13,%xmm13
4460
vpor %xmm5,%xmm2,%xmm2
4461
vpor %xmm7,%xmm10,%xmm10
4462
vpxor %xmm0,%xmm3,%xmm3
4463
vmovdqa 192-128(%rax),%xmm0
4464
4465
vpaddd %xmm15,%xmm12,%xmm12
4466
vpslld $5,%xmm13,%xmm8
4467
vpand %xmm10,%xmm11,%xmm7
4468
vpxor 32-128(%rax),%xmm3,%xmm3
4469
4470
vpaddd %xmm7,%xmm12,%xmm12
4471
vpsrld $27,%xmm13,%xmm9
4472
vpxor %xmm10,%xmm11,%xmm6
4473
vpxor %xmm0,%xmm3,%xmm3
4474
4475
vmovdqu %xmm2,144-128(%rax)
4476
vpaddd %xmm2,%xmm12,%xmm12
4477
vpor %xmm9,%xmm8,%xmm8
4478
vpsrld $31,%xmm3,%xmm5
4479
vpand %xmm14,%xmm6,%xmm6
4480
vpaddd %xmm3,%xmm3,%xmm3
4481
4482
vpslld $30,%xmm14,%xmm7
4483
vpaddd %xmm6,%xmm12,%xmm12
4484
4485
vpsrld $2,%xmm14,%xmm14
4486
vpaddd %xmm8,%xmm12,%xmm12
4487
vpor %xmm5,%xmm3,%xmm3
4488
vpor %xmm7,%xmm14,%xmm14
4489
vpxor %xmm1,%xmm4,%xmm4
4490
vmovdqa 208-128(%rax),%xmm1
4491
4492
vpaddd %xmm15,%xmm11,%xmm11
4493
vpslld $5,%xmm12,%xmm8
4494
vpand %xmm14,%xmm10,%xmm7
4495
vpxor 48-128(%rax),%xmm4,%xmm4
4496
4497
vpaddd %xmm7,%xmm11,%xmm11
4498
vpsrld $27,%xmm12,%xmm9
4499
vpxor %xmm14,%xmm10,%xmm6
4500
vpxor %xmm1,%xmm4,%xmm4
4501
4502
vmovdqu %xmm3,160-128(%rax)
4503
vpaddd %xmm3,%xmm11,%xmm11
4504
vpor %xmm9,%xmm8,%xmm8
4505
vpsrld $31,%xmm4,%xmm5
4506
vpand %xmm13,%xmm6,%xmm6
4507
vpaddd %xmm4,%xmm4,%xmm4
4508
4509
vpslld $30,%xmm13,%xmm7
4510
vpaddd %xmm6,%xmm11,%xmm11
4511
4512
vpsrld $2,%xmm13,%xmm13
4513
vpaddd %xmm8,%xmm11,%xmm11
4514
vpor %xmm5,%xmm4,%xmm4
4515
vpor %xmm7,%xmm13,%xmm13
4516
vpxor %xmm2,%xmm0,%xmm0
4517
vmovdqa 224-128(%rax),%xmm2
4518
4519
vpaddd %xmm15,%xmm10,%xmm10
4520
vpslld $5,%xmm11,%xmm8
4521
vpand %xmm13,%xmm14,%xmm7
4522
vpxor 64-128(%rax),%xmm0,%xmm0
4523
4524
vpaddd %xmm7,%xmm10,%xmm10
4525
vpsrld $27,%xmm11,%xmm9
4526
vpxor %xmm13,%xmm14,%xmm6
4527
vpxor %xmm2,%xmm0,%xmm0
4528
4529
vmovdqu %xmm4,176-128(%rax)
4530
vpaddd %xmm4,%xmm10,%xmm10
4531
vpor %xmm9,%xmm8,%xmm8
4532
vpsrld $31,%xmm0,%xmm5
4533
vpand %xmm12,%xmm6,%xmm6
4534
vpaddd %xmm0,%xmm0,%xmm0
4535
4536
vpslld $30,%xmm12,%xmm7
4537
vpaddd %xmm6,%xmm10,%xmm10
4538
4539
vpsrld $2,%xmm12,%xmm12
4540
vpaddd %xmm8,%xmm10,%xmm10
4541
vpor %xmm5,%xmm0,%xmm0
4542
vpor %xmm7,%xmm12,%xmm12
4543
vmovdqa 64(%rbp),%xmm15
4544
vpxor %xmm3,%xmm1,%xmm1
4545
vmovdqa 240-128(%rax),%xmm3
4546
4547
vpslld $5,%xmm10,%xmm8
4548
vpaddd %xmm15,%xmm14,%xmm14
4549
vpxor %xmm11,%xmm13,%xmm6
4550
vmovdqa %xmm0,192-128(%rax)
4551
vpaddd %xmm0,%xmm14,%xmm14
4552
vpxor 80-128(%rax),%xmm1,%xmm1
4553
vpsrld $27,%xmm10,%xmm9
4554
vpxor %xmm12,%xmm6,%xmm6
4555
vpxor %xmm3,%xmm1,%xmm1
4556
4557
vpslld $30,%xmm11,%xmm7
4558
vpor %xmm9,%xmm8,%xmm8
4559
vpaddd %xmm6,%xmm14,%xmm14
4560
vpsrld $31,%xmm1,%xmm5
4561
vpaddd %xmm1,%xmm1,%xmm1
4562
4563
vpsrld $2,%xmm11,%xmm11
4564
vpaddd %xmm8,%xmm14,%xmm14
4565
vpor %xmm5,%xmm1,%xmm1
4566
vpor %xmm7,%xmm11,%xmm11
4567
vpxor %xmm4,%xmm2,%xmm2
4568
vmovdqa 0-128(%rax),%xmm4
4569
4570
vpslld $5,%xmm14,%xmm8
4571
vpaddd %xmm15,%xmm13,%xmm13
4572
vpxor %xmm10,%xmm12,%xmm6
4573
vmovdqa %xmm1,208-128(%rax)
4574
vpaddd %xmm1,%xmm13,%xmm13
4575
vpxor 96-128(%rax),%xmm2,%xmm2
4576
vpsrld $27,%xmm14,%xmm9
4577
vpxor %xmm11,%xmm6,%xmm6
4578
vpxor %xmm4,%xmm2,%xmm2
4579
4580
vpslld $30,%xmm10,%xmm7
4581
vpor %xmm9,%xmm8,%xmm8
4582
vpaddd %xmm6,%xmm13,%xmm13
4583
vpsrld $31,%xmm2,%xmm5
4584
vpaddd %xmm2,%xmm2,%xmm2
4585
4586
vpsrld $2,%xmm10,%xmm10
4587
vpaddd %xmm8,%xmm13,%xmm13
4588
vpor %xmm5,%xmm2,%xmm2
4589
vpor %xmm7,%xmm10,%xmm10
4590
vpxor %xmm0,%xmm3,%xmm3
4591
vmovdqa 16-128(%rax),%xmm0
4592
4593
vpslld $5,%xmm13,%xmm8
4594
vpaddd %xmm15,%xmm12,%xmm12
4595
vpxor %xmm14,%xmm11,%xmm6
4596
vmovdqa %xmm2,224-128(%rax)
4597
vpaddd %xmm2,%xmm12,%xmm12
4598
vpxor 112-128(%rax),%xmm3,%xmm3
4599
vpsrld $27,%xmm13,%xmm9
4600
vpxor %xmm10,%xmm6,%xmm6
4601
vpxor %xmm0,%xmm3,%xmm3
4602
4603
vpslld $30,%xmm14,%xmm7
4604
vpor %xmm9,%xmm8,%xmm8
4605
vpaddd %xmm6,%xmm12,%xmm12
4606
vpsrld $31,%xmm3,%xmm5
4607
vpaddd %xmm3,%xmm3,%xmm3
4608
4609
vpsrld $2,%xmm14,%xmm14
4610
vpaddd %xmm8,%xmm12,%xmm12
4611
vpor %xmm5,%xmm3,%xmm3
4612
vpor %xmm7,%xmm14,%xmm14
4613
vpxor %xmm1,%xmm4,%xmm4
4614
vmovdqa 32-128(%rax),%xmm1
4615
4616
vpslld $5,%xmm12,%xmm8
4617
vpaddd %xmm15,%xmm11,%xmm11
4618
vpxor %xmm13,%xmm10,%xmm6
4619
vmovdqa %xmm3,240-128(%rax)
4620
vpaddd %xmm3,%xmm11,%xmm11
4621
vpxor 128-128(%rax),%xmm4,%xmm4
4622
vpsrld $27,%xmm12,%xmm9
4623
vpxor %xmm14,%xmm6,%xmm6
4624
vpxor %xmm1,%xmm4,%xmm4
4625
4626
vpslld $30,%xmm13,%xmm7
4627
vpor %xmm9,%xmm8,%xmm8
4628
vpaddd %xmm6,%xmm11,%xmm11
4629
vpsrld $31,%xmm4,%xmm5
4630
vpaddd %xmm4,%xmm4,%xmm4
4631
4632
vpsrld $2,%xmm13,%xmm13
4633
vpaddd %xmm8,%xmm11,%xmm11
4634
vpor %xmm5,%xmm4,%xmm4
4635
vpor %xmm7,%xmm13,%xmm13
4636
vpxor %xmm2,%xmm0,%xmm0
4637
vmovdqa 48-128(%rax),%xmm2
4638
4639
vpslld $5,%xmm11,%xmm8
4640
vpaddd %xmm15,%xmm10,%xmm10
4641
vpxor %xmm12,%xmm14,%xmm6
4642
vmovdqa %xmm4,0-128(%rax)
4643
vpaddd %xmm4,%xmm10,%xmm10
4644
vpxor 144-128(%rax),%xmm0,%xmm0
4645
vpsrld $27,%xmm11,%xmm9
4646
vpxor %xmm13,%xmm6,%xmm6
4647
vpxor %xmm2,%xmm0,%xmm0
4648
4649
vpslld $30,%xmm12,%xmm7
4650
vpor %xmm9,%xmm8,%xmm8
4651
vpaddd %xmm6,%xmm10,%xmm10
4652
vpsrld $31,%xmm0,%xmm5
4653
vpaddd %xmm0,%xmm0,%xmm0
4654
4655
vpsrld $2,%xmm12,%xmm12
4656
vpaddd %xmm8,%xmm10,%xmm10
4657
vpor %xmm5,%xmm0,%xmm0
4658
vpor %xmm7,%xmm12,%xmm12
4659
vpxor %xmm3,%xmm1,%xmm1
4660
vmovdqa 64-128(%rax),%xmm3
4661
4662
vpslld $5,%xmm10,%xmm8
4663
vpaddd %xmm15,%xmm14,%xmm14
4664
vpxor %xmm11,%xmm13,%xmm6
4665
vmovdqa %xmm0,16-128(%rax)
4666
vpaddd %xmm0,%xmm14,%xmm14
4667
vpxor 160-128(%rax),%xmm1,%xmm1
4668
vpsrld $27,%xmm10,%xmm9
4669
vpxor %xmm12,%xmm6,%xmm6
4670
vpxor %xmm3,%xmm1,%xmm1
4671
4672
vpslld $30,%xmm11,%xmm7
4673
vpor %xmm9,%xmm8,%xmm8
4674
vpaddd %xmm6,%xmm14,%xmm14
4675
vpsrld $31,%xmm1,%xmm5
4676
vpaddd %xmm1,%xmm1,%xmm1
4677
4678
vpsrld $2,%xmm11,%xmm11
4679
vpaddd %xmm8,%xmm14,%xmm14
4680
vpor %xmm5,%xmm1,%xmm1
4681
vpor %xmm7,%xmm11,%xmm11
4682
vpxor %xmm4,%xmm2,%xmm2
4683
vmovdqa 80-128(%rax),%xmm4
4684
4685
vpslld $5,%xmm14,%xmm8
4686
vpaddd %xmm15,%xmm13,%xmm13
4687
vpxor %xmm10,%xmm12,%xmm6
4688
vmovdqa %xmm1,32-128(%rax)
4689
vpaddd %xmm1,%xmm13,%xmm13
4690
vpxor 176-128(%rax),%xmm2,%xmm2
4691
vpsrld $27,%xmm14,%xmm9
4692
vpxor %xmm11,%xmm6,%xmm6
4693
vpxor %xmm4,%xmm2,%xmm2
4694
4695
vpslld $30,%xmm10,%xmm7
4696
vpor %xmm9,%xmm8,%xmm8
4697
vpaddd %xmm6,%xmm13,%xmm13
4698
vpsrld $31,%xmm2,%xmm5
4699
vpaddd %xmm2,%xmm2,%xmm2
4700
4701
vpsrld $2,%xmm10,%xmm10
4702
vpaddd %xmm8,%xmm13,%xmm13
4703
vpor %xmm5,%xmm2,%xmm2
4704
vpor %xmm7,%xmm10,%xmm10
4705
vpxor %xmm0,%xmm3,%xmm3
4706
vmovdqa 96-128(%rax),%xmm0
4707
4708
vpslld $5,%xmm13,%xmm8
4709
vpaddd %xmm15,%xmm12,%xmm12
4710
vpxor %xmm14,%xmm11,%xmm6
4711
vmovdqa %xmm2,48-128(%rax)
4712
vpaddd %xmm2,%xmm12,%xmm12
4713
vpxor 192-128(%rax),%xmm3,%xmm3
4714
vpsrld $27,%xmm13,%xmm9
4715
vpxor %xmm10,%xmm6,%xmm6
4716
vpxor %xmm0,%xmm3,%xmm3
4717
4718
vpslld $30,%xmm14,%xmm7
4719
vpor %xmm9,%xmm8,%xmm8
4720
vpaddd %xmm6,%xmm12,%xmm12
4721
vpsrld $31,%xmm3,%xmm5
4722
vpaddd %xmm3,%xmm3,%xmm3
4723
4724
vpsrld $2,%xmm14,%xmm14
4725
vpaddd %xmm8,%xmm12,%xmm12
4726
vpor %xmm5,%xmm3,%xmm3
4727
vpor %xmm7,%xmm14,%xmm14
4728
vpxor %xmm1,%xmm4,%xmm4
4729
vmovdqa 112-128(%rax),%xmm1
4730
4731
vpslld $5,%xmm12,%xmm8
4732
vpaddd %xmm15,%xmm11,%xmm11
4733
vpxor %xmm13,%xmm10,%xmm6
4734
vmovdqa %xmm3,64-128(%rax)
4735
vpaddd %xmm3,%xmm11,%xmm11
4736
vpxor 208-128(%rax),%xmm4,%xmm4
4737
vpsrld $27,%xmm12,%xmm9
4738
vpxor %xmm14,%xmm6,%xmm6
4739
vpxor %xmm1,%xmm4,%xmm4
4740
4741
vpslld $30,%xmm13,%xmm7
4742
vpor %xmm9,%xmm8,%xmm8
4743
vpaddd %xmm6,%xmm11,%xmm11
4744
vpsrld $31,%xmm4,%xmm5
4745
vpaddd %xmm4,%xmm4,%xmm4
4746
4747
vpsrld $2,%xmm13,%xmm13
4748
vpaddd %xmm8,%xmm11,%xmm11
4749
vpor %xmm5,%xmm4,%xmm4
4750
vpor %xmm7,%xmm13,%xmm13
4751
vpxor %xmm2,%xmm0,%xmm0
4752
vmovdqa 128-128(%rax),%xmm2
4753
4754
vpslld $5,%xmm11,%xmm8
4755
vpaddd %xmm15,%xmm10,%xmm10
4756
vpxor %xmm12,%xmm14,%xmm6
4757
vmovdqa %xmm4,80-128(%rax)
4758
vpaddd %xmm4,%xmm10,%xmm10
4759
vpxor 224-128(%rax),%xmm0,%xmm0
4760
vpsrld $27,%xmm11,%xmm9
4761
vpxor %xmm13,%xmm6,%xmm6
4762
vpxor %xmm2,%xmm0,%xmm0
4763
4764
vpslld $30,%xmm12,%xmm7
4765
vpor %xmm9,%xmm8,%xmm8
4766
vpaddd %xmm6,%xmm10,%xmm10
4767
vpsrld $31,%xmm0,%xmm5
4768
vpaddd %xmm0,%xmm0,%xmm0
4769
4770
vpsrld $2,%xmm12,%xmm12
4771
vpaddd %xmm8,%xmm10,%xmm10
4772
vpor %xmm5,%xmm0,%xmm0
4773
vpor %xmm7,%xmm12,%xmm12
4774
vpxor %xmm3,%xmm1,%xmm1
4775
vmovdqa 144-128(%rax),%xmm3
4776
4777
vpslld $5,%xmm10,%xmm8
4778
vpaddd %xmm15,%xmm14,%xmm14
4779
vpxor %xmm11,%xmm13,%xmm6
4780
vmovdqa %xmm0,96-128(%rax)
4781
vpaddd %xmm0,%xmm14,%xmm14
4782
vpxor 240-128(%rax),%xmm1,%xmm1
4783
vpsrld $27,%xmm10,%xmm9
4784
vpxor %xmm12,%xmm6,%xmm6
4785
vpxor %xmm3,%xmm1,%xmm1
4786
4787
vpslld $30,%xmm11,%xmm7
4788
vpor %xmm9,%xmm8,%xmm8
4789
vpaddd %xmm6,%xmm14,%xmm14
4790
vpsrld $31,%xmm1,%xmm5
4791
vpaddd %xmm1,%xmm1,%xmm1
4792
4793
vpsrld $2,%xmm11,%xmm11
4794
vpaddd %xmm8,%xmm14,%xmm14
4795
vpor %xmm5,%xmm1,%xmm1
4796
vpor %xmm7,%xmm11,%xmm11
4797
vpxor %xmm4,%xmm2,%xmm2
4798
vmovdqa 160-128(%rax),%xmm4
4799
4800
vpslld $5,%xmm14,%xmm8
4801
vpaddd %xmm15,%xmm13,%xmm13
4802
vpxor %xmm10,%xmm12,%xmm6
4803
vmovdqa %xmm1,112-128(%rax)
4804
vpaddd %xmm1,%xmm13,%xmm13
4805
vpxor 0-128(%rax),%xmm2,%xmm2
4806
vpsrld $27,%xmm14,%xmm9
4807
vpxor %xmm11,%xmm6,%xmm6
4808
vpxor %xmm4,%xmm2,%xmm2
4809
4810
vpslld $30,%xmm10,%xmm7
4811
vpor %xmm9,%xmm8,%xmm8
4812
vpaddd %xmm6,%xmm13,%xmm13
4813
vpsrld $31,%xmm2,%xmm5
4814
vpaddd %xmm2,%xmm2,%xmm2
4815
4816
vpsrld $2,%xmm10,%xmm10
4817
vpaddd %xmm8,%xmm13,%xmm13
4818
vpor %xmm5,%xmm2,%xmm2
4819
vpor %xmm7,%xmm10,%xmm10
4820
vpxor %xmm0,%xmm3,%xmm3
4821
vmovdqa 176-128(%rax),%xmm0
4822
4823
vpslld $5,%xmm13,%xmm8
4824
vpaddd %xmm15,%xmm12,%xmm12
4825
vpxor %xmm14,%xmm11,%xmm6
4826
vpaddd %xmm2,%xmm12,%xmm12
4827
vpxor 16-128(%rax),%xmm3,%xmm3
4828
vpsrld $27,%xmm13,%xmm9
4829
vpxor %xmm10,%xmm6,%xmm6
4830
vpxor %xmm0,%xmm3,%xmm3
4831
4832
vpslld $30,%xmm14,%xmm7
4833
vpor %xmm9,%xmm8,%xmm8
4834
vpaddd %xmm6,%xmm12,%xmm12
4835
vpsrld $31,%xmm3,%xmm5
4836
vpaddd %xmm3,%xmm3,%xmm3
4837
4838
vpsrld $2,%xmm14,%xmm14
4839
vpaddd %xmm8,%xmm12,%xmm12
4840
vpor %xmm5,%xmm3,%xmm3
4841
vpor %xmm7,%xmm14,%xmm14
4842
vpxor %xmm1,%xmm4,%xmm4
4843
vmovdqa 192-128(%rax),%xmm1
4844
4845
vpslld $5,%xmm12,%xmm8
4846
vpaddd %xmm15,%xmm11,%xmm11
4847
vpxor %xmm13,%xmm10,%xmm6
4848
vpaddd %xmm3,%xmm11,%xmm11
4849
vpxor 32-128(%rax),%xmm4,%xmm4
4850
vpsrld $27,%xmm12,%xmm9
4851
vpxor %xmm14,%xmm6,%xmm6
4852
vpxor %xmm1,%xmm4,%xmm4
4853
4854
vpslld $30,%xmm13,%xmm7
4855
vpor %xmm9,%xmm8,%xmm8
4856
vpaddd %xmm6,%xmm11,%xmm11
4857
vpsrld $31,%xmm4,%xmm5
4858
vpaddd %xmm4,%xmm4,%xmm4
4859
4860
vpsrld $2,%xmm13,%xmm13
4861
vpaddd %xmm8,%xmm11,%xmm11
4862
vpor %xmm5,%xmm4,%xmm4
4863
vpor %xmm7,%xmm13,%xmm13
4864
vpxor %xmm2,%xmm0,%xmm0
4865
vmovdqa 208-128(%rax),%xmm2
4866
4867
vpslld $5,%xmm11,%xmm8
4868
vpaddd %xmm15,%xmm10,%xmm10
4869
vpxor %xmm12,%xmm14,%xmm6
4870
vpaddd %xmm4,%xmm10,%xmm10
4871
vpxor 48-128(%rax),%xmm0,%xmm0
4872
vpsrld $27,%xmm11,%xmm9
4873
vpxor %xmm13,%xmm6,%xmm6
4874
vpxor %xmm2,%xmm0,%xmm0
4875
4876
vpslld $30,%xmm12,%xmm7
4877
vpor %xmm9,%xmm8,%xmm8
4878
vpaddd %xmm6,%xmm10,%xmm10
4879
vpsrld $31,%xmm0,%xmm5
4880
vpaddd %xmm0,%xmm0,%xmm0
4881
4882
vpsrld $2,%xmm12,%xmm12
4883
vpaddd %xmm8,%xmm10,%xmm10
4884
vpor %xmm5,%xmm0,%xmm0
4885
vpor %xmm7,%xmm12,%xmm12
4886
vpxor %xmm3,%xmm1,%xmm1
4887
vmovdqa 224-128(%rax),%xmm3
4888
4889
vpslld $5,%xmm10,%xmm8
4890
vpaddd %xmm15,%xmm14,%xmm14
4891
vpxor %xmm11,%xmm13,%xmm6
4892
vpaddd %xmm0,%xmm14,%xmm14
4893
vpxor 64-128(%rax),%xmm1,%xmm1
4894
vpsrld $27,%xmm10,%xmm9
4895
vpxor %xmm12,%xmm6,%xmm6
4896
vpxor %xmm3,%xmm1,%xmm1
4897
4898
vpslld $30,%xmm11,%xmm7
4899
vpor %xmm9,%xmm8,%xmm8
4900
vpaddd %xmm6,%xmm14,%xmm14
4901
vpsrld $31,%xmm1,%xmm5
4902
vpaddd %xmm1,%xmm1,%xmm1
4903
4904
vpsrld $2,%xmm11,%xmm11
4905
vpaddd %xmm8,%xmm14,%xmm14
4906
vpor %xmm5,%xmm1,%xmm1
4907
vpor %xmm7,%xmm11,%xmm11
4908
vpxor %xmm4,%xmm2,%xmm2
4909
vmovdqa 240-128(%rax),%xmm4
4910
4911
vpslld $5,%xmm14,%xmm8
4912
vpaddd %xmm15,%xmm13,%xmm13
4913
vpxor %xmm10,%xmm12,%xmm6
4914
vpaddd %xmm1,%xmm13,%xmm13
4915
vpxor 80-128(%rax),%xmm2,%xmm2
4916
vpsrld $27,%xmm14,%xmm9
4917
vpxor %xmm11,%xmm6,%xmm6
4918
vpxor %xmm4,%xmm2,%xmm2
4919
4920
vpslld $30,%xmm10,%xmm7
4921
vpor %xmm9,%xmm8,%xmm8
4922
vpaddd %xmm6,%xmm13,%xmm13
4923
vpsrld $31,%xmm2,%xmm5
4924
vpaddd %xmm2,%xmm2,%xmm2
4925
4926
vpsrld $2,%xmm10,%xmm10
4927
vpaddd %xmm8,%xmm13,%xmm13
4928
vpor %xmm5,%xmm2,%xmm2
4929
vpor %xmm7,%xmm10,%xmm10
4930
vpxor %xmm0,%xmm3,%xmm3
4931
vmovdqa 0-128(%rax),%xmm0
4932
4933
vpslld $5,%xmm13,%xmm8
4934
vpaddd %xmm15,%xmm12,%xmm12
4935
vpxor %xmm14,%xmm11,%xmm6
4936
vpaddd %xmm2,%xmm12,%xmm12
4937
vpxor 96-128(%rax),%xmm3,%xmm3
4938
vpsrld $27,%xmm13,%xmm9
4939
vpxor %xmm10,%xmm6,%xmm6
4940
vpxor %xmm0,%xmm3,%xmm3
4941
4942
vpslld $30,%xmm14,%xmm7
4943
vpor %xmm9,%xmm8,%xmm8
4944
vpaddd %xmm6,%xmm12,%xmm12
4945
vpsrld $31,%xmm3,%xmm5
4946
vpaddd %xmm3,%xmm3,%xmm3
4947
4948
vpsrld $2,%xmm14,%xmm14
4949
vpaddd %xmm8,%xmm12,%xmm12
4950
vpor %xmm5,%xmm3,%xmm3
4951
vpor %xmm7,%xmm14,%xmm14
4952
vpxor %xmm1,%xmm4,%xmm4
4953
vmovdqa 16-128(%rax),%xmm1
4954
4955
vpslld $5,%xmm12,%xmm8
4956
vpaddd %xmm15,%xmm11,%xmm11
4957
vpxor %xmm13,%xmm10,%xmm6
4958
vpaddd %xmm3,%xmm11,%xmm11
4959
vpxor 112-128(%rax),%xmm4,%xmm4
4960
vpsrld $27,%xmm12,%xmm9
4961
vpxor %xmm14,%xmm6,%xmm6
4962
vpxor %xmm1,%xmm4,%xmm4
4963
4964
vpslld $30,%xmm13,%xmm7
4965
vpor %xmm9,%xmm8,%xmm8
4966
vpaddd %xmm6,%xmm11,%xmm11
4967
vpsrld $31,%xmm4,%xmm5
4968
vpaddd %xmm4,%xmm4,%xmm4
4969
4970
vpsrld $2,%xmm13,%xmm13
4971
vpaddd %xmm8,%xmm11,%xmm11
4972
vpor %xmm5,%xmm4,%xmm4
4973
vpor %xmm7,%xmm13,%xmm13
4974
vpslld $5,%xmm11,%xmm8
4975
vpaddd %xmm15,%xmm10,%xmm10
4976
vpxor %xmm12,%xmm14,%xmm6
4977
4978
vpsrld $27,%xmm11,%xmm9
4979
vpaddd %xmm4,%xmm10,%xmm10
4980
vpxor %xmm13,%xmm6,%xmm6
4981
4982
vpslld $30,%xmm12,%xmm7
4983
vpor %xmm9,%xmm8,%xmm8
4984
vpaddd %xmm6,%xmm10,%xmm10
4985
4986
vpsrld $2,%xmm12,%xmm12
4987
vpaddd %xmm8,%xmm10,%xmm10
4988
vpor %xmm7,%xmm12,%xmm12
4989
movl $1,%ecx
4990
cmpl 0(%rbx),%ecx
4991
cmovgeq %rbp,%r8
4992
cmpl 4(%rbx),%ecx
4993
cmovgeq %rbp,%r9
4994
cmpl 8(%rbx),%ecx
4995
cmovgeq %rbp,%r10
4996
cmpl 12(%rbx),%ecx
4997
cmovgeq %rbp,%r11
4998
vmovdqu (%rbx),%xmm6
4999
vpxor %xmm8,%xmm8,%xmm8
5000
vmovdqa %xmm6,%xmm7
5001
vpcmpgtd %xmm8,%xmm7,%xmm7
5002
vpaddd %xmm7,%xmm6,%xmm6
5003
5004
vpand %xmm7,%xmm10,%xmm10
5005
vpand %xmm7,%xmm11,%xmm11
5006
vpaddd 0(%rdi),%xmm10,%xmm10
5007
vpand %xmm7,%xmm12,%xmm12
5008
vpaddd 32(%rdi),%xmm11,%xmm11
5009
vpand %xmm7,%xmm13,%xmm13
5010
vpaddd 64(%rdi),%xmm12,%xmm12
5011
vpand %xmm7,%xmm14,%xmm14
5012
vpaddd 96(%rdi),%xmm13,%xmm13
5013
vpaddd 128(%rdi),%xmm14,%xmm14
5014
vmovdqu %xmm10,0(%rdi)
5015
vmovdqu %xmm11,32(%rdi)
5016
vmovdqu %xmm12,64(%rdi)
5017
vmovdqu %xmm13,96(%rdi)
5018
vmovdqu %xmm14,128(%rdi)
5019
5020
vmovdqu %xmm6,(%rbx)
5021
vmovdqu 96(%rbp),%xmm5
5022
decl %edx
5023
jnz .Loop_avx
5024
5025
movl 280(%rsp),%edx
5026
leaq 16(%rdi),%rdi
5027
leaq 64(%rsi),%rsi
5028
decl %edx
5029
jnz .Loop_grande_avx
5030
5031
.Ldone_avx:
5032
movq 272(%rsp),%rax
5033
.cfi_def_cfa %rax,8
5034
vzeroupper
5035
movq -16(%rax),%rbp
5036
.cfi_restore %rbp
5037
movq -8(%rax),%rbx
5038
.cfi_restore %rbx
5039
leaq (%rax),%rsp
5040
.cfi_def_cfa_register %rsp
5041
.Lepilogue_avx:
5042
.byte 0xf3,0xc3
5043
.cfi_endproc
5044
.size sha1_multi_block_avx,.-sha1_multi_block_avx
5045
.type sha1_multi_block_avx2,@function
5046
.align 32
5047
sha1_multi_block_avx2:
5048
.cfi_startproc
5049
_avx2_shortcut:
5050
movq %rsp,%rax
5051
.cfi_def_cfa_register %rax
5052
pushq %rbx
5053
.cfi_offset %rbx,-16
5054
pushq %rbp
5055
.cfi_offset %rbp,-24
5056
pushq %r12
5057
.cfi_offset %r12,-32
5058
pushq %r13
5059
.cfi_offset %r13,-40
5060
pushq %r14
5061
.cfi_offset %r14,-48
5062
pushq %r15
5063
.cfi_offset %r15,-56
5064
subq $576,%rsp
5065
andq $-256,%rsp
5066
movq %rax,544(%rsp)
5067
.cfi_escape 0x0f,0x06,0x77,0xa0,0x04,0x06,0x23,0x08
5068
.Lbody_avx2:
5069
leaq K_XX_XX(%rip),%rbp
5070
shrl $1,%edx
5071
5072
vzeroupper
5073
.Loop_grande_avx2:
5074
movl %edx,552(%rsp)
5075
xorl %edx,%edx
5076
leaq 512(%rsp),%rbx
5077
5078
movq 0(%rsi),%r12
5079
5080
movl 8(%rsi),%ecx
5081
cmpl %edx,%ecx
5082
cmovgl %ecx,%edx
5083
testl %ecx,%ecx
5084
movl %ecx,0(%rbx)
5085
cmovleq %rbp,%r12
5086
5087
movq 16(%rsi),%r13
5088
5089
movl 24(%rsi),%ecx
5090
cmpl %edx,%ecx
5091
cmovgl %ecx,%edx
5092
testl %ecx,%ecx
5093
movl %ecx,4(%rbx)
5094
cmovleq %rbp,%r13
5095
5096
movq 32(%rsi),%r14
5097
5098
movl 40(%rsi),%ecx
5099
cmpl %edx,%ecx
5100
cmovgl %ecx,%edx
5101
testl %ecx,%ecx
5102
movl %ecx,8(%rbx)
5103
cmovleq %rbp,%r14
5104
5105
movq 48(%rsi),%r15
5106
5107
movl 56(%rsi),%ecx
5108
cmpl %edx,%ecx
5109
cmovgl %ecx,%edx
5110
testl %ecx,%ecx
5111
movl %ecx,12(%rbx)
5112
cmovleq %rbp,%r15
5113
5114
movq 64(%rsi),%r8
5115
5116
movl 72(%rsi),%ecx
5117
cmpl %edx,%ecx
5118
cmovgl %ecx,%edx
5119
testl %ecx,%ecx
5120
movl %ecx,16(%rbx)
5121
cmovleq %rbp,%r8
5122
5123
movq 80(%rsi),%r9
5124
5125
movl 88(%rsi),%ecx
5126
cmpl %edx,%ecx
5127
cmovgl %ecx,%edx
5128
testl %ecx,%ecx
5129
movl %ecx,20(%rbx)
5130
cmovleq %rbp,%r9
5131
5132
movq 96(%rsi),%r10
5133
5134
movl 104(%rsi),%ecx
5135
cmpl %edx,%ecx
5136
cmovgl %ecx,%edx
5137
testl %ecx,%ecx
5138
movl %ecx,24(%rbx)
5139
cmovleq %rbp,%r10
5140
5141
movq 112(%rsi),%r11
5142
5143
movl 120(%rsi),%ecx
5144
cmpl %edx,%ecx
5145
cmovgl %ecx,%edx
5146
testl %ecx,%ecx
5147
movl %ecx,28(%rbx)
5148
cmovleq %rbp,%r11
5149
vmovdqu 0(%rdi),%ymm0
5150
leaq 128(%rsp),%rax
5151
vmovdqu 32(%rdi),%ymm1
5152
leaq 256+128(%rsp),%rbx
5153
vmovdqu 64(%rdi),%ymm2
5154
vmovdqu 96(%rdi),%ymm3
5155
vmovdqu 128(%rdi),%ymm4
5156
vmovdqu 96(%rbp),%ymm9
5157
jmp .Loop_avx2
5158
5159
.align 32
5160
.Loop_avx2:
5161
vmovdqa -32(%rbp),%ymm15
5162
vmovd (%r12),%xmm10
5163
leaq 64(%r12),%r12
5164
vmovd (%r8),%xmm12
5165
leaq 64(%r8),%r8
5166
vmovd (%r13),%xmm7
5167
leaq 64(%r13),%r13
5168
vmovd (%r9),%xmm6
5169
leaq 64(%r9),%r9
5170
vpinsrd $1,(%r14),%xmm10,%xmm10
5171
leaq 64(%r14),%r14
5172
vpinsrd $1,(%r10),%xmm12,%xmm12
5173
leaq 64(%r10),%r10
5174
vpinsrd $1,(%r15),%xmm7,%xmm7
5175
leaq 64(%r15),%r15
5176
vpunpckldq %ymm7,%ymm10,%ymm10
5177
vpinsrd $1,(%r11),%xmm6,%xmm6
5178
leaq 64(%r11),%r11
5179
vpunpckldq %ymm6,%ymm12,%ymm12
5180
vmovd -60(%r12),%xmm11
5181
vinserti128 $1,%xmm12,%ymm10,%ymm10
5182
vmovd -60(%r8),%xmm8
5183
vpshufb %ymm9,%ymm10,%ymm10
5184
vmovd -60(%r13),%xmm7
5185
vmovd -60(%r9),%xmm6
5186
vpinsrd $1,-60(%r14),%xmm11,%xmm11
5187
vpinsrd $1,-60(%r10),%xmm8,%xmm8
5188
vpinsrd $1,-60(%r15),%xmm7,%xmm7
5189
vpunpckldq %ymm7,%ymm11,%ymm11
5190
vpinsrd $1,-60(%r11),%xmm6,%xmm6
5191
vpunpckldq %ymm6,%ymm8,%ymm8
5192
vpaddd %ymm15,%ymm4,%ymm4
5193
vpslld $5,%ymm0,%ymm7
5194
vpandn %ymm3,%ymm1,%ymm6
5195
vpand %ymm2,%ymm1,%ymm5
5196
5197
vmovdqa %ymm10,0-128(%rax)
5198
vpaddd %ymm10,%ymm4,%ymm4
5199
vinserti128 $1,%xmm8,%ymm11,%ymm11
5200
vpsrld $27,%ymm0,%ymm8
5201
vpxor %ymm6,%ymm5,%ymm5
5202
vmovd -56(%r12),%xmm12
5203
5204
vpslld $30,%ymm1,%ymm6
5205
vpor %ymm8,%ymm7,%ymm7
5206
vmovd -56(%r8),%xmm8
5207
vpaddd %ymm5,%ymm4,%ymm4
5208
5209
vpsrld $2,%ymm1,%ymm1
5210
vpaddd %ymm7,%ymm4,%ymm4
5211
vpshufb %ymm9,%ymm11,%ymm11
5212
vpor %ymm6,%ymm1,%ymm1
5213
vmovd -56(%r13),%xmm7
5214
vmovd -56(%r9),%xmm6
5215
vpinsrd $1,-56(%r14),%xmm12,%xmm12
5216
vpinsrd $1,-56(%r10),%xmm8,%xmm8
5217
vpinsrd $1,-56(%r15),%xmm7,%xmm7
5218
vpunpckldq %ymm7,%ymm12,%ymm12
5219
vpinsrd $1,-56(%r11),%xmm6,%xmm6
5220
vpunpckldq %ymm6,%ymm8,%ymm8
5221
vpaddd %ymm15,%ymm3,%ymm3
5222
vpslld $5,%ymm4,%ymm7
5223
vpandn %ymm2,%ymm0,%ymm6
5224
vpand %ymm1,%ymm0,%ymm5
5225
5226
vmovdqa %ymm11,32-128(%rax)
5227
vpaddd %ymm11,%ymm3,%ymm3
5228
vinserti128 $1,%xmm8,%ymm12,%ymm12
5229
vpsrld $27,%ymm4,%ymm8
5230
vpxor %ymm6,%ymm5,%ymm5
5231
vmovd -52(%r12),%xmm13
5232
5233
vpslld $30,%ymm0,%ymm6
5234
vpor %ymm8,%ymm7,%ymm7
5235
vmovd -52(%r8),%xmm8
5236
vpaddd %ymm5,%ymm3,%ymm3
5237
5238
vpsrld $2,%ymm0,%ymm0
5239
vpaddd %ymm7,%ymm3,%ymm3
5240
vpshufb %ymm9,%ymm12,%ymm12
5241
vpor %ymm6,%ymm0,%ymm0
5242
vmovd -52(%r13),%xmm7
5243
vmovd -52(%r9),%xmm6
5244
vpinsrd $1,-52(%r14),%xmm13,%xmm13
5245
vpinsrd $1,-52(%r10),%xmm8,%xmm8
5246
vpinsrd $1,-52(%r15),%xmm7,%xmm7
5247
vpunpckldq %ymm7,%ymm13,%ymm13
5248
vpinsrd $1,-52(%r11),%xmm6,%xmm6
5249
vpunpckldq %ymm6,%ymm8,%ymm8
5250
vpaddd %ymm15,%ymm2,%ymm2
5251
vpslld $5,%ymm3,%ymm7
5252
vpandn %ymm1,%ymm4,%ymm6
5253
vpand %ymm0,%ymm4,%ymm5
5254
5255
vmovdqa %ymm12,64-128(%rax)
5256
vpaddd %ymm12,%ymm2,%ymm2
5257
vinserti128 $1,%xmm8,%ymm13,%ymm13
5258
vpsrld $27,%ymm3,%ymm8
5259
vpxor %ymm6,%ymm5,%ymm5
5260
vmovd -48(%r12),%xmm14
5261
5262
vpslld $30,%ymm4,%ymm6
5263
vpor %ymm8,%ymm7,%ymm7
5264
vmovd -48(%r8),%xmm8
5265
vpaddd %ymm5,%ymm2,%ymm2
5266
5267
vpsrld $2,%ymm4,%ymm4
5268
vpaddd %ymm7,%ymm2,%ymm2
5269
vpshufb %ymm9,%ymm13,%ymm13
5270
vpor %ymm6,%ymm4,%ymm4
5271
vmovd -48(%r13),%xmm7
5272
vmovd -48(%r9),%xmm6
5273
vpinsrd $1,-48(%r14),%xmm14,%xmm14
5274
vpinsrd $1,-48(%r10),%xmm8,%xmm8
5275
vpinsrd $1,-48(%r15),%xmm7,%xmm7
5276
vpunpckldq %ymm7,%ymm14,%ymm14
5277
vpinsrd $1,-48(%r11),%xmm6,%xmm6
5278
vpunpckldq %ymm6,%ymm8,%ymm8
5279
vpaddd %ymm15,%ymm1,%ymm1
5280
vpslld $5,%ymm2,%ymm7
5281
vpandn %ymm0,%ymm3,%ymm6
5282
vpand %ymm4,%ymm3,%ymm5
5283
5284
vmovdqa %ymm13,96-128(%rax)
5285
vpaddd %ymm13,%ymm1,%ymm1
5286
vinserti128 $1,%xmm8,%ymm14,%ymm14
5287
vpsrld $27,%ymm2,%ymm8
5288
vpxor %ymm6,%ymm5,%ymm5
5289
vmovd -44(%r12),%xmm10
5290
5291
vpslld $30,%ymm3,%ymm6
5292
vpor %ymm8,%ymm7,%ymm7
5293
vmovd -44(%r8),%xmm8
5294
vpaddd %ymm5,%ymm1,%ymm1
5295
5296
vpsrld $2,%ymm3,%ymm3
5297
vpaddd %ymm7,%ymm1,%ymm1
5298
vpshufb %ymm9,%ymm14,%ymm14
5299
vpor %ymm6,%ymm3,%ymm3
5300
vmovd -44(%r13),%xmm7
5301
vmovd -44(%r9),%xmm6
5302
vpinsrd $1,-44(%r14),%xmm10,%xmm10
5303
vpinsrd $1,-44(%r10),%xmm8,%xmm8
5304
vpinsrd $1,-44(%r15),%xmm7,%xmm7
5305
vpunpckldq %ymm7,%ymm10,%ymm10
5306
vpinsrd $1,-44(%r11),%xmm6,%xmm6
5307
vpunpckldq %ymm6,%ymm8,%ymm8
5308
vpaddd %ymm15,%ymm0,%ymm0
5309
vpslld $5,%ymm1,%ymm7
5310
vpandn %ymm4,%ymm2,%ymm6
5311
vpand %ymm3,%ymm2,%ymm5
5312
5313
vmovdqa %ymm14,128-128(%rax)
5314
vpaddd %ymm14,%ymm0,%ymm0
5315
vinserti128 $1,%xmm8,%ymm10,%ymm10
5316
vpsrld $27,%ymm1,%ymm8
5317
vpxor %ymm6,%ymm5,%ymm5
5318
vmovd -40(%r12),%xmm11
5319
5320
vpslld $30,%ymm2,%ymm6
5321
vpor %ymm8,%ymm7,%ymm7
5322
vmovd -40(%r8),%xmm8
5323
vpaddd %ymm5,%ymm0,%ymm0
5324
5325
vpsrld $2,%ymm2,%ymm2
5326
vpaddd %ymm7,%ymm0,%ymm0
5327
vpshufb %ymm9,%ymm10,%ymm10
5328
vpor %ymm6,%ymm2,%ymm2
5329
vmovd -40(%r13),%xmm7
5330
vmovd -40(%r9),%xmm6
5331
vpinsrd $1,-40(%r14),%xmm11,%xmm11
5332
vpinsrd $1,-40(%r10),%xmm8,%xmm8
5333
vpinsrd $1,-40(%r15),%xmm7,%xmm7
5334
vpunpckldq %ymm7,%ymm11,%ymm11
5335
vpinsrd $1,-40(%r11),%xmm6,%xmm6
5336
vpunpckldq %ymm6,%ymm8,%ymm8
5337
vpaddd %ymm15,%ymm4,%ymm4
5338
vpslld $5,%ymm0,%ymm7
5339
vpandn %ymm3,%ymm1,%ymm6
5340
vpand %ymm2,%ymm1,%ymm5
5341
5342
vmovdqa %ymm10,160-128(%rax)
5343
vpaddd %ymm10,%ymm4,%ymm4
5344
vinserti128 $1,%xmm8,%ymm11,%ymm11
5345
vpsrld $27,%ymm0,%ymm8
5346
vpxor %ymm6,%ymm5,%ymm5
5347
vmovd -36(%r12),%xmm12
5348
5349
vpslld $30,%ymm1,%ymm6
5350
vpor %ymm8,%ymm7,%ymm7
5351
vmovd -36(%r8),%xmm8
5352
vpaddd %ymm5,%ymm4,%ymm4
5353
5354
vpsrld $2,%ymm1,%ymm1
5355
vpaddd %ymm7,%ymm4,%ymm4
5356
vpshufb %ymm9,%ymm11,%ymm11
5357
vpor %ymm6,%ymm1,%ymm1
5358
vmovd -36(%r13),%xmm7
5359
vmovd -36(%r9),%xmm6
5360
vpinsrd $1,-36(%r14),%xmm12,%xmm12
5361
vpinsrd $1,-36(%r10),%xmm8,%xmm8
5362
vpinsrd $1,-36(%r15),%xmm7,%xmm7
5363
vpunpckldq %ymm7,%ymm12,%ymm12
5364
vpinsrd $1,-36(%r11),%xmm6,%xmm6
5365
vpunpckldq %ymm6,%ymm8,%ymm8
5366
vpaddd %ymm15,%ymm3,%ymm3
5367
vpslld $5,%ymm4,%ymm7
5368
vpandn %ymm2,%ymm0,%ymm6
5369
vpand %ymm1,%ymm0,%ymm5
5370
5371
vmovdqa %ymm11,192-128(%rax)
5372
vpaddd %ymm11,%ymm3,%ymm3
5373
vinserti128 $1,%xmm8,%ymm12,%ymm12
5374
vpsrld $27,%ymm4,%ymm8
5375
vpxor %ymm6,%ymm5,%ymm5
5376
vmovd -32(%r12),%xmm13
5377
5378
vpslld $30,%ymm0,%ymm6
5379
vpor %ymm8,%ymm7,%ymm7
5380
vmovd -32(%r8),%xmm8
5381
vpaddd %ymm5,%ymm3,%ymm3
5382
5383
vpsrld $2,%ymm0,%ymm0
5384
vpaddd %ymm7,%ymm3,%ymm3
5385
vpshufb %ymm9,%ymm12,%ymm12
5386
vpor %ymm6,%ymm0,%ymm0
5387
vmovd -32(%r13),%xmm7
5388
vmovd -32(%r9),%xmm6
5389
vpinsrd $1,-32(%r14),%xmm13,%xmm13
5390
vpinsrd $1,-32(%r10),%xmm8,%xmm8
5391
vpinsrd $1,-32(%r15),%xmm7,%xmm7
5392
vpunpckldq %ymm7,%ymm13,%ymm13
5393
vpinsrd $1,-32(%r11),%xmm6,%xmm6
5394
vpunpckldq %ymm6,%ymm8,%ymm8
5395
vpaddd %ymm15,%ymm2,%ymm2
5396
vpslld $5,%ymm3,%ymm7
5397
vpandn %ymm1,%ymm4,%ymm6
5398
vpand %ymm0,%ymm4,%ymm5
5399
5400
vmovdqa %ymm12,224-128(%rax)
5401
vpaddd %ymm12,%ymm2,%ymm2
5402
vinserti128 $1,%xmm8,%ymm13,%ymm13
5403
vpsrld $27,%ymm3,%ymm8
5404
vpxor %ymm6,%ymm5,%ymm5
5405
vmovd -28(%r12),%xmm14
5406
5407
vpslld $30,%ymm4,%ymm6
5408
vpor %ymm8,%ymm7,%ymm7
5409
vmovd -28(%r8),%xmm8
5410
vpaddd %ymm5,%ymm2,%ymm2
5411
5412
vpsrld $2,%ymm4,%ymm4
5413
vpaddd %ymm7,%ymm2,%ymm2
5414
vpshufb %ymm9,%ymm13,%ymm13
5415
vpor %ymm6,%ymm4,%ymm4
5416
vmovd -28(%r13),%xmm7
5417
vmovd -28(%r9),%xmm6
5418
vpinsrd $1,-28(%r14),%xmm14,%xmm14
5419
vpinsrd $1,-28(%r10),%xmm8,%xmm8
5420
vpinsrd $1,-28(%r15),%xmm7,%xmm7
5421
vpunpckldq %ymm7,%ymm14,%ymm14
5422
vpinsrd $1,-28(%r11),%xmm6,%xmm6
5423
vpunpckldq %ymm6,%ymm8,%ymm8
5424
vpaddd %ymm15,%ymm1,%ymm1
5425
vpslld $5,%ymm2,%ymm7
5426
vpandn %ymm0,%ymm3,%ymm6
5427
vpand %ymm4,%ymm3,%ymm5
5428
5429
vmovdqa %ymm13,256-256-128(%rbx)
5430
vpaddd %ymm13,%ymm1,%ymm1
5431
vinserti128 $1,%xmm8,%ymm14,%ymm14
5432
vpsrld $27,%ymm2,%ymm8
5433
vpxor %ymm6,%ymm5,%ymm5
5434
vmovd -24(%r12),%xmm10
5435
5436
vpslld $30,%ymm3,%ymm6
5437
vpor %ymm8,%ymm7,%ymm7
5438
vmovd -24(%r8),%xmm8
5439
vpaddd %ymm5,%ymm1,%ymm1
5440
5441
vpsrld $2,%ymm3,%ymm3
5442
vpaddd %ymm7,%ymm1,%ymm1
5443
vpshufb %ymm9,%ymm14,%ymm14
5444
vpor %ymm6,%ymm3,%ymm3
5445
vmovd -24(%r13),%xmm7
5446
vmovd -24(%r9),%xmm6
5447
vpinsrd $1,-24(%r14),%xmm10,%xmm10
5448
vpinsrd $1,-24(%r10),%xmm8,%xmm8
5449
vpinsrd $1,-24(%r15),%xmm7,%xmm7
5450
vpunpckldq %ymm7,%ymm10,%ymm10
5451
vpinsrd $1,-24(%r11),%xmm6,%xmm6
5452
vpunpckldq %ymm6,%ymm8,%ymm8
5453
vpaddd %ymm15,%ymm0,%ymm0
5454
vpslld $5,%ymm1,%ymm7
5455
vpandn %ymm4,%ymm2,%ymm6
5456
vpand %ymm3,%ymm2,%ymm5
5457
5458
vmovdqa %ymm14,288-256-128(%rbx)
5459
vpaddd %ymm14,%ymm0,%ymm0
5460
vinserti128 $1,%xmm8,%ymm10,%ymm10
5461
vpsrld $27,%ymm1,%ymm8
5462
vpxor %ymm6,%ymm5,%ymm5
5463
vmovd -20(%r12),%xmm11
5464
5465
vpslld $30,%ymm2,%ymm6
5466
vpor %ymm8,%ymm7,%ymm7
5467
vmovd -20(%r8),%xmm8
5468
vpaddd %ymm5,%ymm0,%ymm0
5469
5470
vpsrld $2,%ymm2,%ymm2
5471
vpaddd %ymm7,%ymm0,%ymm0
5472
vpshufb %ymm9,%ymm10,%ymm10
5473
vpor %ymm6,%ymm2,%ymm2
5474
vmovd -20(%r13),%xmm7
5475
vmovd -20(%r9),%xmm6
5476
vpinsrd $1,-20(%r14),%xmm11,%xmm11
5477
vpinsrd $1,-20(%r10),%xmm8,%xmm8
5478
vpinsrd $1,-20(%r15),%xmm7,%xmm7
5479
vpunpckldq %ymm7,%ymm11,%ymm11
5480
vpinsrd $1,-20(%r11),%xmm6,%xmm6
5481
vpunpckldq %ymm6,%ymm8,%ymm8
5482
vpaddd %ymm15,%ymm4,%ymm4
5483
vpslld $5,%ymm0,%ymm7
5484
vpandn %ymm3,%ymm1,%ymm6
5485
vpand %ymm2,%ymm1,%ymm5
5486
5487
vmovdqa %ymm10,320-256-128(%rbx)
5488
vpaddd %ymm10,%ymm4,%ymm4
5489
vinserti128 $1,%xmm8,%ymm11,%ymm11
5490
vpsrld $27,%ymm0,%ymm8
5491
vpxor %ymm6,%ymm5,%ymm5
5492
vmovd -16(%r12),%xmm12
5493
5494
vpslld $30,%ymm1,%ymm6
5495
vpor %ymm8,%ymm7,%ymm7
5496
vmovd -16(%r8),%xmm8
5497
vpaddd %ymm5,%ymm4,%ymm4
5498
5499
vpsrld $2,%ymm1,%ymm1
5500
vpaddd %ymm7,%ymm4,%ymm4
5501
vpshufb %ymm9,%ymm11,%ymm11
5502
vpor %ymm6,%ymm1,%ymm1
5503
vmovd -16(%r13),%xmm7
5504
vmovd -16(%r9),%xmm6
5505
vpinsrd $1,-16(%r14),%xmm12,%xmm12
5506
vpinsrd $1,-16(%r10),%xmm8,%xmm8
5507
vpinsrd $1,-16(%r15),%xmm7,%xmm7
5508
vpunpckldq %ymm7,%ymm12,%ymm12
5509
vpinsrd $1,-16(%r11),%xmm6,%xmm6
5510
vpunpckldq %ymm6,%ymm8,%ymm8
5511
vpaddd %ymm15,%ymm3,%ymm3
5512
vpslld $5,%ymm4,%ymm7
5513
vpandn %ymm2,%ymm0,%ymm6
5514
vpand %ymm1,%ymm0,%ymm5
5515
5516
vmovdqa %ymm11,352-256-128(%rbx)
5517
vpaddd %ymm11,%ymm3,%ymm3
5518
vinserti128 $1,%xmm8,%ymm12,%ymm12
5519
vpsrld $27,%ymm4,%ymm8
5520
vpxor %ymm6,%ymm5,%ymm5
5521
vmovd -12(%r12),%xmm13
5522
5523
vpslld $30,%ymm0,%ymm6
5524
vpor %ymm8,%ymm7,%ymm7
5525
vmovd -12(%r8),%xmm8
5526
vpaddd %ymm5,%ymm3,%ymm3
5527
5528
vpsrld $2,%ymm0,%ymm0
5529
vpaddd %ymm7,%ymm3,%ymm3
5530
vpshufb %ymm9,%ymm12,%ymm12
5531
vpor %ymm6,%ymm0,%ymm0
5532
vmovd -12(%r13),%xmm7
5533
vmovd -12(%r9),%xmm6
5534
vpinsrd $1,-12(%r14),%xmm13,%xmm13
5535
vpinsrd $1,-12(%r10),%xmm8,%xmm8
5536
vpinsrd $1,-12(%r15),%xmm7,%xmm7
5537
vpunpckldq %ymm7,%ymm13,%ymm13
5538
vpinsrd $1,-12(%r11),%xmm6,%xmm6
5539
vpunpckldq %ymm6,%ymm8,%ymm8
5540
vpaddd %ymm15,%ymm2,%ymm2
5541
vpslld $5,%ymm3,%ymm7
5542
vpandn %ymm1,%ymm4,%ymm6
5543
vpand %ymm0,%ymm4,%ymm5
5544
5545
vmovdqa %ymm12,384-256-128(%rbx)
5546
vpaddd %ymm12,%ymm2,%ymm2
5547
vinserti128 $1,%xmm8,%ymm13,%ymm13
5548
vpsrld $27,%ymm3,%ymm8
5549
vpxor %ymm6,%ymm5,%ymm5
5550
vmovd -8(%r12),%xmm14
5551
5552
vpslld $30,%ymm4,%ymm6
5553
vpor %ymm8,%ymm7,%ymm7
5554
vmovd -8(%r8),%xmm8
5555
vpaddd %ymm5,%ymm2,%ymm2
5556
5557
vpsrld $2,%ymm4,%ymm4
5558
vpaddd %ymm7,%ymm2,%ymm2
5559
vpshufb %ymm9,%ymm13,%ymm13
5560
vpor %ymm6,%ymm4,%ymm4
5561
vmovd -8(%r13),%xmm7
5562
vmovd -8(%r9),%xmm6
5563
vpinsrd $1,-8(%r14),%xmm14,%xmm14
5564
vpinsrd $1,-8(%r10),%xmm8,%xmm8
5565
vpinsrd $1,-8(%r15),%xmm7,%xmm7
5566
vpunpckldq %ymm7,%ymm14,%ymm14
5567
vpinsrd $1,-8(%r11),%xmm6,%xmm6
5568
vpunpckldq %ymm6,%ymm8,%ymm8
5569
vpaddd %ymm15,%ymm1,%ymm1
5570
vpslld $5,%ymm2,%ymm7
5571
vpandn %ymm0,%ymm3,%ymm6
5572
vpand %ymm4,%ymm3,%ymm5
5573
5574
vmovdqa %ymm13,416-256-128(%rbx)
5575
vpaddd %ymm13,%ymm1,%ymm1
5576
vinserti128 $1,%xmm8,%ymm14,%ymm14
5577
vpsrld $27,%ymm2,%ymm8
5578
vpxor %ymm6,%ymm5,%ymm5
5579
vmovd -4(%r12),%xmm10
5580
5581
vpslld $30,%ymm3,%ymm6
5582
vpor %ymm8,%ymm7,%ymm7
5583
vmovd -4(%r8),%xmm8
5584
vpaddd %ymm5,%ymm1,%ymm1
5585
5586
vpsrld $2,%ymm3,%ymm3
5587
vpaddd %ymm7,%ymm1,%ymm1
5588
vpshufb %ymm9,%ymm14,%ymm14
5589
vpor %ymm6,%ymm3,%ymm3
5590
vmovdqa 0-128(%rax),%ymm11
5591
vmovd -4(%r13),%xmm7
5592
vmovd -4(%r9),%xmm6
5593
vpinsrd $1,-4(%r14),%xmm10,%xmm10
5594
vpinsrd $1,-4(%r10),%xmm8,%xmm8
5595
vpinsrd $1,-4(%r15),%xmm7,%xmm7
5596
vpunpckldq %ymm7,%ymm10,%ymm10
5597
vpinsrd $1,-4(%r11),%xmm6,%xmm6
5598
vpunpckldq %ymm6,%ymm8,%ymm8
5599
vpaddd %ymm15,%ymm0,%ymm0
5600
prefetcht0 63(%r12)
5601
vpslld $5,%ymm1,%ymm7
5602
vpandn %ymm4,%ymm2,%ymm6
5603
vpand %ymm3,%ymm2,%ymm5
5604
5605
vmovdqa %ymm14,448-256-128(%rbx)
5606
vpaddd %ymm14,%ymm0,%ymm0
5607
vinserti128 $1,%xmm8,%ymm10,%ymm10
5608
vpsrld $27,%ymm1,%ymm8
5609
prefetcht0 63(%r13)
5610
vpxor %ymm6,%ymm5,%ymm5
5611
5612
vpslld $30,%ymm2,%ymm6
5613
vpor %ymm8,%ymm7,%ymm7
5614
prefetcht0 63(%r14)
5615
vpaddd %ymm5,%ymm0,%ymm0
5616
5617
vpsrld $2,%ymm2,%ymm2
5618
vpaddd %ymm7,%ymm0,%ymm0
5619
prefetcht0 63(%r15)
5620
vpshufb %ymm9,%ymm10,%ymm10
5621
vpor %ymm6,%ymm2,%ymm2
5622
vmovdqa 32-128(%rax),%ymm12
5623
vpxor %ymm13,%ymm11,%ymm11
5624
vmovdqa 64-128(%rax),%ymm13
5625
5626
vpaddd %ymm15,%ymm4,%ymm4
5627
vpslld $5,%ymm0,%ymm7
5628
vpandn %ymm3,%ymm1,%ymm6
5629
prefetcht0 63(%r8)
5630
vpand %ymm2,%ymm1,%ymm5
5631
5632
vmovdqa %ymm10,480-256-128(%rbx)
5633
vpaddd %ymm10,%ymm4,%ymm4
5634
vpxor 256-256-128(%rbx),%ymm11,%ymm11
5635
vpsrld $27,%ymm0,%ymm8
5636
vpxor %ymm6,%ymm5,%ymm5
5637
vpxor %ymm13,%ymm11,%ymm11
5638
prefetcht0 63(%r9)
5639
5640
vpslld $30,%ymm1,%ymm6
5641
vpor %ymm8,%ymm7,%ymm7
5642
vpaddd %ymm5,%ymm4,%ymm4
5643
prefetcht0 63(%r10)
5644
vpsrld $31,%ymm11,%ymm9
5645
vpaddd %ymm11,%ymm11,%ymm11
5646
5647
vpsrld $2,%ymm1,%ymm1
5648
prefetcht0 63(%r11)
5649
vpaddd %ymm7,%ymm4,%ymm4
5650
vpor %ymm9,%ymm11,%ymm11
5651
vpor %ymm6,%ymm1,%ymm1
5652
vpxor %ymm14,%ymm12,%ymm12
5653
vmovdqa 96-128(%rax),%ymm14
5654
5655
vpaddd %ymm15,%ymm3,%ymm3
5656
vpslld $5,%ymm4,%ymm7
5657
vpandn %ymm2,%ymm0,%ymm6
5658
5659
vpand %ymm1,%ymm0,%ymm5
5660
5661
vmovdqa %ymm11,0-128(%rax)
5662
vpaddd %ymm11,%ymm3,%ymm3
5663
vpxor 288-256-128(%rbx),%ymm12,%ymm12
5664
vpsrld $27,%ymm4,%ymm8
5665
vpxor %ymm6,%ymm5,%ymm5
5666
vpxor %ymm14,%ymm12,%ymm12
5667
5668
5669
vpslld $30,%ymm0,%ymm6
5670
vpor %ymm8,%ymm7,%ymm7
5671
vpaddd %ymm5,%ymm3,%ymm3
5672
5673
vpsrld $31,%ymm12,%ymm9
5674
vpaddd %ymm12,%ymm12,%ymm12
5675
5676
vpsrld $2,%ymm0,%ymm0
5677
5678
vpaddd %ymm7,%ymm3,%ymm3
5679
vpor %ymm9,%ymm12,%ymm12
5680
vpor %ymm6,%ymm0,%ymm0
5681
vpxor %ymm10,%ymm13,%ymm13
5682
vmovdqa 128-128(%rax),%ymm10
5683
5684
vpaddd %ymm15,%ymm2,%ymm2
5685
vpslld $5,%ymm3,%ymm7
5686
vpandn %ymm1,%ymm4,%ymm6
5687
5688
vpand %ymm0,%ymm4,%ymm5
5689
5690
vmovdqa %ymm12,32-128(%rax)
5691
vpaddd %ymm12,%ymm2,%ymm2
5692
vpxor 320-256-128(%rbx),%ymm13,%ymm13
5693
vpsrld $27,%ymm3,%ymm8
5694
vpxor %ymm6,%ymm5,%ymm5
5695
vpxor %ymm10,%ymm13,%ymm13
5696
5697
5698
vpslld $30,%ymm4,%ymm6
5699
vpor %ymm8,%ymm7,%ymm7
5700
vpaddd %ymm5,%ymm2,%ymm2
5701
5702
vpsrld $31,%ymm13,%ymm9
5703
vpaddd %ymm13,%ymm13,%ymm13
5704
5705
vpsrld $2,%ymm4,%ymm4
5706
5707
vpaddd %ymm7,%ymm2,%ymm2
5708
vpor %ymm9,%ymm13,%ymm13
5709
vpor %ymm6,%ymm4,%ymm4
5710
vpxor %ymm11,%ymm14,%ymm14
5711
vmovdqa 160-128(%rax),%ymm11
5712
5713
vpaddd %ymm15,%ymm1,%ymm1
5714
vpslld $5,%ymm2,%ymm7
5715
vpandn %ymm0,%ymm3,%ymm6
5716
5717
vpand %ymm4,%ymm3,%ymm5
5718
5719
vmovdqa %ymm13,64-128(%rax)
5720
vpaddd %ymm13,%ymm1,%ymm1
5721
vpxor 352-256-128(%rbx),%ymm14,%ymm14
5722
vpsrld $27,%ymm2,%ymm8
5723
vpxor %ymm6,%ymm5,%ymm5
5724
vpxor %ymm11,%ymm14,%ymm14
5725
5726
5727
vpslld $30,%ymm3,%ymm6
5728
vpor %ymm8,%ymm7,%ymm7
5729
vpaddd %ymm5,%ymm1,%ymm1
5730
5731
vpsrld $31,%ymm14,%ymm9
5732
vpaddd %ymm14,%ymm14,%ymm14
5733
5734
vpsrld $2,%ymm3,%ymm3
5735
5736
vpaddd %ymm7,%ymm1,%ymm1
5737
vpor %ymm9,%ymm14,%ymm14
5738
vpor %ymm6,%ymm3,%ymm3
5739
vpxor %ymm12,%ymm10,%ymm10
5740
vmovdqa 192-128(%rax),%ymm12
5741
5742
vpaddd %ymm15,%ymm0,%ymm0
5743
vpslld $5,%ymm1,%ymm7
5744
vpandn %ymm4,%ymm2,%ymm6
5745
5746
vpand %ymm3,%ymm2,%ymm5
5747
5748
vmovdqa %ymm14,96-128(%rax)
5749
vpaddd %ymm14,%ymm0,%ymm0
5750
vpxor 384-256-128(%rbx),%ymm10,%ymm10
5751
vpsrld $27,%ymm1,%ymm8
5752
vpxor %ymm6,%ymm5,%ymm5
5753
vpxor %ymm12,%ymm10,%ymm10
5754
5755
5756
vpslld $30,%ymm2,%ymm6
5757
vpor %ymm8,%ymm7,%ymm7
5758
vpaddd %ymm5,%ymm0,%ymm0
5759
5760
vpsrld $31,%ymm10,%ymm9
5761
vpaddd %ymm10,%ymm10,%ymm10
5762
5763
vpsrld $2,%ymm2,%ymm2
5764
5765
vpaddd %ymm7,%ymm0,%ymm0
5766
vpor %ymm9,%ymm10,%ymm10
5767
vpor %ymm6,%ymm2,%ymm2
5768
vmovdqa 0(%rbp),%ymm15
5769
vpxor %ymm13,%ymm11,%ymm11
5770
vmovdqa 224-128(%rax),%ymm13
5771
5772
vpslld $5,%ymm0,%ymm7
5773
vpaddd %ymm15,%ymm4,%ymm4
5774
vpxor %ymm1,%ymm3,%ymm5
5775
vmovdqa %ymm10,128-128(%rax)
5776
vpaddd %ymm10,%ymm4,%ymm4
5777
vpxor 416-256-128(%rbx),%ymm11,%ymm11
5778
vpsrld $27,%ymm0,%ymm8
5779
vpxor %ymm2,%ymm5,%ymm5
5780
vpxor %ymm13,%ymm11,%ymm11
5781
5782
vpslld $30,%ymm1,%ymm6
5783
vpor %ymm8,%ymm7,%ymm7
5784
vpaddd %ymm5,%ymm4,%ymm4
5785
vpsrld $31,%ymm11,%ymm9
5786
vpaddd %ymm11,%ymm11,%ymm11
5787
5788
vpsrld $2,%ymm1,%ymm1
5789
vpaddd %ymm7,%ymm4,%ymm4
5790
vpor %ymm9,%ymm11,%ymm11
5791
vpor %ymm6,%ymm1,%ymm1
5792
vpxor %ymm14,%ymm12,%ymm12
5793
vmovdqa 256-256-128(%rbx),%ymm14
5794
5795
vpslld $5,%ymm4,%ymm7
5796
vpaddd %ymm15,%ymm3,%ymm3
5797
vpxor %ymm0,%ymm2,%ymm5
5798
vmovdqa %ymm11,160-128(%rax)
5799
vpaddd %ymm11,%ymm3,%ymm3
5800
vpxor 448-256-128(%rbx),%ymm12,%ymm12
5801
vpsrld $27,%ymm4,%ymm8
5802
vpxor %ymm1,%ymm5,%ymm5
5803
vpxor %ymm14,%ymm12,%ymm12
5804
5805
vpslld $30,%ymm0,%ymm6
5806
vpor %ymm8,%ymm7,%ymm7
5807
vpaddd %ymm5,%ymm3,%ymm3
5808
vpsrld $31,%ymm12,%ymm9
5809
vpaddd %ymm12,%ymm12,%ymm12
5810
5811
vpsrld $2,%ymm0,%ymm0
5812
vpaddd %ymm7,%ymm3,%ymm3
5813
vpor %ymm9,%ymm12,%ymm12
5814
vpor %ymm6,%ymm0,%ymm0
5815
vpxor %ymm10,%ymm13,%ymm13
5816
vmovdqa 288-256-128(%rbx),%ymm10
5817
5818
vpslld $5,%ymm3,%ymm7
5819
vpaddd %ymm15,%ymm2,%ymm2
5820
vpxor %ymm4,%ymm1,%ymm5
5821
vmovdqa %ymm12,192-128(%rax)
5822
vpaddd %ymm12,%ymm2,%ymm2
5823
vpxor 480-256-128(%rbx),%ymm13,%ymm13
5824
vpsrld $27,%ymm3,%ymm8
5825
vpxor %ymm0,%ymm5,%ymm5
5826
vpxor %ymm10,%ymm13,%ymm13
5827
5828
vpslld $30,%ymm4,%ymm6
5829
vpor %ymm8,%ymm7,%ymm7
5830
vpaddd %ymm5,%ymm2,%ymm2
5831
vpsrld $31,%ymm13,%ymm9
5832
vpaddd %ymm13,%ymm13,%ymm13
5833
5834
vpsrld $2,%ymm4,%ymm4
5835
vpaddd %ymm7,%ymm2,%ymm2
5836
vpor %ymm9,%ymm13,%ymm13
5837
vpor %ymm6,%ymm4,%ymm4
5838
vpxor %ymm11,%ymm14,%ymm14
5839
vmovdqa 320-256-128(%rbx),%ymm11
5840
5841
vpslld $5,%ymm2,%ymm7
5842
vpaddd %ymm15,%ymm1,%ymm1
5843
vpxor %ymm3,%ymm0,%ymm5
5844
vmovdqa %ymm13,224-128(%rax)
5845
vpaddd %ymm13,%ymm1,%ymm1
5846
vpxor 0-128(%rax),%ymm14,%ymm14
5847
vpsrld $27,%ymm2,%ymm8
5848
vpxor %ymm4,%ymm5,%ymm5
5849
vpxor %ymm11,%ymm14,%ymm14
5850
5851
vpslld $30,%ymm3,%ymm6
5852
vpor %ymm8,%ymm7,%ymm7
5853
vpaddd %ymm5,%ymm1,%ymm1
5854
vpsrld $31,%ymm14,%ymm9
5855
vpaddd %ymm14,%ymm14,%ymm14
5856
5857
vpsrld $2,%ymm3,%ymm3
5858
vpaddd %ymm7,%ymm1,%ymm1
5859
vpor %ymm9,%ymm14,%ymm14
5860
vpor %ymm6,%ymm3,%ymm3
5861
vpxor %ymm12,%ymm10,%ymm10
5862
vmovdqa 352-256-128(%rbx),%ymm12
5863
5864
vpslld $5,%ymm1,%ymm7
5865
vpaddd %ymm15,%ymm0,%ymm0
5866
vpxor %ymm2,%ymm4,%ymm5
5867
vmovdqa %ymm14,256-256-128(%rbx)
5868
vpaddd %ymm14,%ymm0,%ymm0
5869
vpxor 32-128(%rax),%ymm10,%ymm10
5870
vpsrld $27,%ymm1,%ymm8
5871
vpxor %ymm3,%ymm5,%ymm5
5872
vpxor %ymm12,%ymm10,%ymm10
5873
5874
vpslld $30,%ymm2,%ymm6
5875
vpor %ymm8,%ymm7,%ymm7
5876
vpaddd %ymm5,%ymm0,%ymm0
5877
vpsrld $31,%ymm10,%ymm9
5878
vpaddd %ymm10,%ymm10,%ymm10
5879
5880
vpsrld $2,%ymm2,%ymm2
5881
vpaddd %ymm7,%ymm0,%ymm0
5882
vpor %ymm9,%ymm10,%ymm10
5883
vpor %ymm6,%ymm2,%ymm2
5884
vpxor %ymm13,%ymm11,%ymm11
5885
vmovdqa 384-256-128(%rbx),%ymm13
5886
5887
vpslld $5,%ymm0,%ymm7
5888
vpaddd %ymm15,%ymm4,%ymm4
5889
vpxor %ymm1,%ymm3,%ymm5
5890
vmovdqa %ymm10,288-256-128(%rbx)
5891
vpaddd %ymm10,%ymm4,%ymm4
5892
vpxor 64-128(%rax),%ymm11,%ymm11
5893
vpsrld $27,%ymm0,%ymm8
5894
vpxor %ymm2,%ymm5,%ymm5
5895
vpxor %ymm13,%ymm11,%ymm11
5896
5897
vpslld $30,%ymm1,%ymm6
5898
vpor %ymm8,%ymm7,%ymm7
5899
vpaddd %ymm5,%ymm4,%ymm4
5900
vpsrld $31,%ymm11,%ymm9
5901
vpaddd %ymm11,%ymm11,%ymm11
5902
5903
vpsrld $2,%ymm1,%ymm1
5904
vpaddd %ymm7,%ymm4,%ymm4
5905
vpor %ymm9,%ymm11,%ymm11
5906
vpor %ymm6,%ymm1,%ymm1
5907
vpxor %ymm14,%ymm12,%ymm12
5908
vmovdqa 416-256-128(%rbx),%ymm14
5909
5910
vpslld $5,%ymm4,%ymm7
5911
vpaddd %ymm15,%ymm3,%ymm3
5912
vpxor %ymm0,%ymm2,%ymm5
5913
vmovdqa %ymm11,320-256-128(%rbx)
5914
vpaddd %ymm11,%ymm3,%ymm3
5915
vpxor 96-128(%rax),%ymm12,%ymm12
5916
vpsrld $27,%ymm4,%ymm8
5917
vpxor %ymm1,%ymm5,%ymm5
5918
vpxor %ymm14,%ymm12,%ymm12
5919
5920
vpslld $30,%ymm0,%ymm6
5921
vpor %ymm8,%ymm7,%ymm7
5922
vpaddd %ymm5,%ymm3,%ymm3
5923
vpsrld $31,%ymm12,%ymm9
5924
vpaddd %ymm12,%ymm12,%ymm12
5925
5926
vpsrld $2,%ymm0,%ymm0
5927
vpaddd %ymm7,%ymm3,%ymm3
5928
vpor %ymm9,%ymm12,%ymm12
5929
vpor %ymm6,%ymm0,%ymm0
5930
vpxor %ymm10,%ymm13,%ymm13
5931
vmovdqa 448-256-128(%rbx),%ymm10
5932
5933
vpslld $5,%ymm3,%ymm7
5934
vpaddd %ymm15,%ymm2,%ymm2
5935
vpxor %ymm4,%ymm1,%ymm5
5936
vmovdqa %ymm12,352-256-128(%rbx)
5937
vpaddd %ymm12,%ymm2,%ymm2
5938
vpxor 128-128(%rax),%ymm13,%ymm13
5939
vpsrld $27,%ymm3,%ymm8
5940
vpxor %ymm0,%ymm5,%ymm5
5941
vpxor %ymm10,%ymm13,%ymm13
5942
5943
vpslld $30,%ymm4,%ymm6
5944
vpor %ymm8,%ymm7,%ymm7
5945
vpaddd %ymm5,%ymm2,%ymm2
5946
vpsrld $31,%ymm13,%ymm9
5947
vpaddd %ymm13,%ymm13,%ymm13
5948
5949
vpsrld $2,%ymm4,%ymm4
5950
vpaddd %ymm7,%ymm2,%ymm2
5951
vpor %ymm9,%ymm13,%ymm13
5952
vpor %ymm6,%ymm4,%ymm4
5953
vpxor %ymm11,%ymm14,%ymm14
5954
vmovdqa 480-256-128(%rbx),%ymm11
5955
5956
vpslld $5,%ymm2,%ymm7
5957
vpaddd %ymm15,%ymm1,%ymm1
5958
vpxor %ymm3,%ymm0,%ymm5
5959
vmovdqa %ymm13,384-256-128(%rbx)
5960
vpaddd %ymm13,%ymm1,%ymm1
5961
vpxor 160-128(%rax),%ymm14,%ymm14
5962
vpsrld $27,%ymm2,%ymm8
5963
vpxor %ymm4,%ymm5,%ymm5
5964
vpxor %ymm11,%ymm14,%ymm14
5965
5966
vpslld $30,%ymm3,%ymm6
5967
vpor %ymm8,%ymm7,%ymm7
5968
vpaddd %ymm5,%ymm1,%ymm1
5969
vpsrld $31,%ymm14,%ymm9
5970
vpaddd %ymm14,%ymm14,%ymm14
5971
5972
vpsrld $2,%ymm3,%ymm3
5973
vpaddd %ymm7,%ymm1,%ymm1
5974
vpor %ymm9,%ymm14,%ymm14
5975
vpor %ymm6,%ymm3,%ymm3
5976
vpxor %ymm12,%ymm10,%ymm10
5977
vmovdqa 0-128(%rax),%ymm12
5978
5979
vpslld $5,%ymm1,%ymm7
5980
vpaddd %ymm15,%ymm0,%ymm0
5981
vpxor %ymm2,%ymm4,%ymm5
5982
vmovdqa %ymm14,416-256-128(%rbx)
5983
vpaddd %ymm14,%ymm0,%ymm0
5984
vpxor 192-128(%rax),%ymm10,%ymm10
5985
vpsrld $27,%ymm1,%ymm8
5986
vpxor %ymm3,%ymm5,%ymm5
5987
vpxor %ymm12,%ymm10,%ymm10
5988
5989
vpslld $30,%ymm2,%ymm6
5990
vpor %ymm8,%ymm7,%ymm7
5991
vpaddd %ymm5,%ymm0,%ymm0
5992
vpsrld $31,%ymm10,%ymm9
5993
vpaddd %ymm10,%ymm10,%ymm10
5994
5995
vpsrld $2,%ymm2,%ymm2
5996
vpaddd %ymm7,%ymm0,%ymm0
5997
vpor %ymm9,%ymm10,%ymm10
5998
vpor %ymm6,%ymm2,%ymm2
5999
vpxor %ymm13,%ymm11,%ymm11
6000
vmovdqa 32-128(%rax),%ymm13
6001
6002
vpslld $5,%ymm0,%ymm7
6003
vpaddd %ymm15,%ymm4,%ymm4
6004
vpxor %ymm1,%ymm3,%ymm5
6005
vmovdqa %ymm10,448-256-128(%rbx)
6006
vpaddd %ymm10,%ymm4,%ymm4
6007
vpxor 224-128(%rax),%ymm11,%ymm11
6008
vpsrld $27,%ymm0,%ymm8
6009
vpxor %ymm2,%ymm5,%ymm5
6010
vpxor %ymm13,%ymm11,%ymm11
6011
6012
vpslld $30,%ymm1,%ymm6
6013
vpor %ymm8,%ymm7,%ymm7
6014
vpaddd %ymm5,%ymm4,%ymm4
6015
vpsrld $31,%ymm11,%ymm9
6016
vpaddd %ymm11,%ymm11,%ymm11
6017
6018
vpsrld $2,%ymm1,%ymm1
6019
vpaddd %ymm7,%ymm4,%ymm4
6020
vpor %ymm9,%ymm11,%ymm11
6021
vpor %ymm6,%ymm1,%ymm1
6022
vpxor %ymm14,%ymm12,%ymm12
6023
vmovdqa 64-128(%rax),%ymm14
6024
6025
vpslld $5,%ymm4,%ymm7
6026
vpaddd %ymm15,%ymm3,%ymm3
6027
vpxor %ymm0,%ymm2,%ymm5
6028
vmovdqa %ymm11,480-256-128(%rbx)
6029
vpaddd %ymm11,%ymm3,%ymm3
6030
vpxor 256-256-128(%rbx),%ymm12,%ymm12
6031
vpsrld $27,%ymm4,%ymm8
6032
vpxor %ymm1,%ymm5,%ymm5
6033
vpxor %ymm14,%ymm12,%ymm12
6034
6035
vpslld $30,%ymm0,%ymm6
6036
vpor %ymm8,%ymm7,%ymm7
6037
vpaddd %ymm5,%ymm3,%ymm3
6038
vpsrld $31,%ymm12,%ymm9
6039
vpaddd %ymm12,%ymm12,%ymm12
6040
6041
vpsrld $2,%ymm0,%ymm0
6042
vpaddd %ymm7,%ymm3,%ymm3
6043
vpor %ymm9,%ymm12,%ymm12
6044
vpor %ymm6,%ymm0,%ymm0
6045
vpxor %ymm10,%ymm13,%ymm13
6046
vmovdqa 96-128(%rax),%ymm10
6047
6048
vpslld $5,%ymm3,%ymm7
6049
vpaddd %ymm15,%ymm2,%ymm2
6050
vpxor %ymm4,%ymm1,%ymm5
6051
vmovdqa %ymm12,0-128(%rax)
6052
vpaddd %ymm12,%ymm2,%ymm2
6053
vpxor 288-256-128(%rbx),%ymm13,%ymm13
6054
vpsrld $27,%ymm3,%ymm8
6055
vpxor %ymm0,%ymm5,%ymm5
6056
vpxor %ymm10,%ymm13,%ymm13
6057
6058
vpslld $30,%ymm4,%ymm6
6059
vpor %ymm8,%ymm7,%ymm7
6060
vpaddd %ymm5,%ymm2,%ymm2
6061
vpsrld $31,%ymm13,%ymm9
6062
vpaddd %ymm13,%ymm13,%ymm13
6063
6064
vpsrld $2,%ymm4,%ymm4
6065
vpaddd %ymm7,%ymm2,%ymm2
6066
vpor %ymm9,%ymm13,%ymm13
6067
vpor %ymm6,%ymm4,%ymm4
6068
vpxor %ymm11,%ymm14,%ymm14
6069
vmovdqa 128-128(%rax),%ymm11
6070
6071
vpslld $5,%ymm2,%ymm7
6072
vpaddd %ymm15,%ymm1,%ymm1
6073
vpxor %ymm3,%ymm0,%ymm5
6074
vmovdqa %ymm13,32-128(%rax)
6075
vpaddd %ymm13,%ymm1,%ymm1
6076
vpxor 320-256-128(%rbx),%ymm14,%ymm14
6077
vpsrld $27,%ymm2,%ymm8
6078
vpxor %ymm4,%ymm5,%ymm5
6079
vpxor %ymm11,%ymm14,%ymm14
6080
6081
vpslld $30,%ymm3,%ymm6
6082
vpor %ymm8,%ymm7,%ymm7
6083
vpaddd %ymm5,%ymm1,%ymm1
6084
vpsrld $31,%ymm14,%ymm9
6085
vpaddd %ymm14,%ymm14,%ymm14
6086
6087
vpsrld $2,%ymm3,%ymm3
6088
vpaddd %ymm7,%ymm1,%ymm1
6089
vpor %ymm9,%ymm14,%ymm14
6090
vpor %ymm6,%ymm3,%ymm3
6091
vpxor %ymm12,%ymm10,%ymm10
6092
vmovdqa 160-128(%rax),%ymm12
6093
6094
vpslld $5,%ymm1,%ymm7
6095
vpaddd %ymm15,%ymm0,%ymm0
6096
vpxor %ymm2,%ymm4,%ymm5
6097
vmovdqa %ymm14,64-128(%rax)
6098
vpaddd %ymm14,%ymm0,%ymm0
6099
vpxor 352-256-128(%rbx),%ymm10,%ymm10
6100
vpsrld $27,%ymm1,%ymm8
6101
vpxor %ymm3,%ymm5,%ymm5
6102
vpxor %ymm12,%ymm10,%ymm10
6103
6104
vpslld $30,%ymm2,%ymm6
6105
vpor %ymm8,%ymm7,%ymm7
6106
vpaddd %ymm5,%ymm0,%ymm0
6107
vpsrld $31,%ymm10,%ymm9
6108
vpaddd %ymm10,%ymm10,%ymm10
6109
6110
vpsrld $2,%ymm2,%ymm2
6111
vpaddd %ymm7,%ymm0,%ymm0
6112
vpor %ymm9,%ymm10,%ymm10
6113
vpor %ymm6,%ymm2,%ymm2
6114
vpxor %ymm13,%ymm11,%ymm11
6115
vmovdqa 192-128(%rax),%ymm13
6116
6117
vpslld $5,%ymm0,%ymm7
6118
vpaddd %ymm15,%ymm4,%ymm4
6119
vpxor %ymm1,%ymm3,%ymm5
6120
vmovdqa %ymm10,96-128(%rax)
6121
vpaddd %ymm10,%ymm4,%ymm4
6122
vpxor 384-256-128(%rbx),%ymm11,%ymm11
6123
vpsrld $27,%ymm0,%ymm8
6124
vpxor %ymm2,%ymm5,%ymm5
6125
vpxor %ymm13,%ymm11,%ymm11
6126
6127
vpslld $30,%ymm1,%ymm6
6128
vpor %ymm8,%ymm7,%ymm7
6129
vpaddd %ymm5,%ymm4,%ymm4
6130
vpsrld $31,%ymm11,%ymm9
6131
vpaddd %ymm11,%ymm11,%ymm11
6132
6133
vpsrld $2,%ymm1,%ymm1
6134
vpaddd %ymm7,%ymm4,%ymm4
6135
vpor %ymm9,%ymm11,%ymm11
6136
vpor %ymm6,%ymm1,%ymm1
6137
vpxor %ymm14,%ymm12,%ymm12
6138
vmovdqa 224-128(%rax),%ymm14
6139
6140
vpslld $5,%ymm4,%ymm7
6141
vpaddd %ymm15,%ymm3,%ymm3
6142
vpxor %ymm0,%ymm2,%ymm5
6143
vmovdqa %ymm11,128-128(%rax)
6144
vpaddd %ymm11,%ymm3,%ymm3
6145
vpxor 416-256-128(%rbx),%ymm12,%ymm12
6146
vpsrld $27,%ymm4,%ymm8
6147
vpxor %ymm1,%ymm5,%ymm5
6148
vpxor %ymm14,%ymm12,%ymm12
6149
6150
vpslld $30,%ymm0,%ymm6
6151
vpor %ymm8,%ymm7,%ymm7
6152
vpaddd %ymm5,%ymm3,%ymm3
6153
vpsrld $31,%ymm12,%ymm9
6154
vpaddd %ymm12,%ymm12,%ymm12
6155
6156
vpsrld $2,%ymm0,%ymm0
6157
vpaddd %ymm7,%ymm3,%ymm3
6158
vpor %ymm9,%ymm12,%ymm12
6159
vpor %ymm6,%ymm0,%ymm0
6160
vpxor %ymm10,%ymm13,%ymm13
6161
vmovdqa 256-256-128(%rbx),%ymm10
6162
6163
vpslld $5,%ymm3,%ymm7
6164
vpaddd %ymm15,%ymm2,%ymm2
6165
vpxor %ymm4,%ymm1,%ymm5
6166
vmovdqa %ymm12,160-128(%rax)
6167
vpaddd %ymm12,%ymm2,%ymm2
6168
vpxor 448-256-128(%rbx),%ymm13,%ymm13
6169
vpsrld $27,%ymm3,%ymm8
6170
vpxor %ymm0,%ymm5,%ymm5
6171
vpxor %ymm10,%ymm13,%ymm13
6172
6173
vpslld $30,%ymm4,%ymm6
6174
vpor %ymm8,%ymm7,%ymm7
6175
vpaddd %ymm5,%ymm2,%ymm2
6176
vpsrld $31,%ymm13,%ymm9
6177
vpaddd %ymm13,%ymm13,%ymm13
6178
6179
vpsrld $2,%ymm4,%ymm4
6180
vpaddd %ymm7,%ymm2,%ymm2
6181
vpor %ymm9,%ymm13,%ymm13
6182
vpor %ymm6,%ymm4,%ymm4
6183
vpxor %ymm11,%ymm14,%ymm14
6184
vmovdqa 288-256-128(%rbx),%ymm11
6185
6186
vpslld $5,%ymm2,%ymm7
6187
vpaddd %ymm15,%ymm1,%ymm1
6188
vpxor %ymm3,%ymm0,%ymm5
6189
vmovdqa %ymm13,192-128(%rax)
6190
vpaddd %ymm13,%ymm1,%ymm1
6191
vpxor 480-256-128(%rbx),%ymm14,%ymm14
6192
vpsrld $27,%ymm2,%ymm8
6193
vpxor %ymm4,%ymm5,%ymm5
6194
vpxor %ymm11,%ymm14,%ymm14
6195
6196
vpslld $30,%ymm3,%ymm6
6197
vpor %ymm8,%ymm7,%ymm7
6198
vpaddd %ymm5,%ymm1,%ymm1
6199
vpsrld $31,%ymm14,%ymm9
6200
vpaddd %ymm14,%ymm14,%ymm14
6201
6202
vpsrld $2,%ymm3,%ymm3
6203
vpaddd %ymm7,%ymm1,%ymm1
6204
vpor %ymm9,%ymm14,%ymm14
6205
vpor %ymm6,%ymm3,%ymm3
6206
vpxor %ymm12,%ymm10,%ymm10
6207
vmovdqa 320-256-128(%rbx),%ymm12
6208
6209
vpslld $5,%ymm1,%ymm7
6210
vpaddd %ymm15,%ymm0,%ymm0
6211
vpxor %ymm2,%ymm4,%ymm5
6212
vmovdqa %ymm14,224-128(%rax)
6213
vpaddd %ymm14,%ymm0,%ymm0
6214
vpxor 0-128(%rax),%ymm10,%ymm10
6215
vpsrld $27,%ymm1,%ymm8
6216
vpxor %ymm3,%ymm5,%ymm5
6217
vpxor %ymm12,%ymm10,%ymm10
6218
6219
vpslld $30,%ymm2,%ymm6
6220
vpor %ymm8,%ymm7,%ymm7
6221
vpaddd %ymm5,%ymm0,%ymm0
6222
vpsrld $31,%ymm10,%ymm9
6223
vpaddd %ymm10,%ymm10,%ymm10
6224
6225
vpsrld $2,%ymm2,%ymm2
6226
vpaddd %ymm7,%ymm0,%ymm0
6227
vpor %ymm9,%ymm10,%ymm10
6228
vpor %ymm6,%ymm2,%ymm2
6229
vmovdqa 32(%rbp),%ymm15
6230
vpxor %ymm13,%ymm11,%ymm11
6231
vmovdqa 352-256-128(%rbx),%ymm13
6232
6233
vpaddd %ymm15,%ymm4,%ymm4
6234
vpslld $5,%ymm0,%ymm7
6235
vpand %ymm2,%ymm3,%ymm6
6236
vpxor 32-128(%rax),%ymm11,%ymm11
6237
6238
vpaddd %ymm6,%ymm4,%ymm4
6239
vpsrld $27,%ymm0,%ymm8
6240
vpxor %ymm2,%ymm3,%ymm5
6241
vpxor %ymm13,%ymm11,%ymm11
6242
6243
vmovdqu %ymm10,256-256-128(%rbx)
6244
vpaddd %ymm10,%ymm4,%ymm4
6245
vpor %ymm8,%ymm7,%ymm7
6246
vpsrld $31,%ymm11,%ymm9
6247
vpand %ymm1,%ymm5,%ymm5
6248
vpaddd %ymm11,%ymm11,%ymm11
6249
6250
vpslld $30,%ymm1,%ymm6
6251
vpaddd %ymm5,%ymm4,%ymm4
6252
6253
vpsrld $2,%ymm1,%ymm1
6254
vpaddd %ymm7,%ymm4,%ymm4
6255
vpor %ymm9,%ymm11,%ymm11
6256
vpor %ymm6,%ymm1,%ymm1
6257
vpxor %ymm14,%ymm12,%ymm12
6258
vmovdqa 384-256-128(%rbx),%ymm14
6259
6260
vpaddd %ymm15,%ymm3,%ymm3
6261
vpslld $5,%ymm4,%ymm7
6262
vpand %ymm1,%ymm2,%ymm6
6263
vpxor 64-128(%rax),%ymm12,%ymm12
6264
6265
vpaddd %ymm6,%ymm3,%ymm3
6266
vpsrld $27,%ymm4,%ymm8
6267
vpxor %ymm1,%ymm2,%ymm5
6268
vpxor %ymm14,%ymm12,%ymm12
6269
6270
vmovdqu %ymm11,288-256-128(%rbx)
6271
vpaddd %ymm11,%ymm3,%ymm3
6272
vpor %ymm8,%ymm7,%ymm7
6273
vpsrld $31,%ymm12,%ymm9
6274
vpand %ymm0,%ymm5,%ymm5
6275
vpaddd %ymm12,%ymm12,%ymm12
6276
6277
vpslld $30,%ymm0,%ymm6
6278
vpaddd %ymm5,%ymm3,%ymm3
6279
6280
vpsrld $2,%ymm0,%ymm0
6281
vpaddd %ymm7,%ymm3,%ymm3
6282
vpor %ymm9,%ymm12,%ymm12
6283
vpor %ymm6,%ymm0,%ymm0
6284
vpxor %ymm10,%ymm13,%ymm13
6285
vmovdqa 416-256-128(%rbx),%ymm10
6286
6287
vpaddd %ymm15,%ymm2,%ymm2
6288
vpslld $5,%ymm3,%ymm7
6289
vpand %ymm0,%ymm1,%ymm6
6290
vpxor 96-128(%rax),%ymm13,%ymm13
6291
6292
vpaddd %ymm6,%ymm2,%ymm2
6293
vpsrld $27,%ymm3,%ymm8
6294
vpxor %ymm0,%ymm1,%ymm5
6295
vpxor %ymm10,%ymm13,%ymm13
6296
6297
vmovdqu %ymm12,320-256-128(%rbx)
6298
vpaddd %ymm12,%ymm2,%ymm2
6299
vpor %ymm8,%ymm7,%ymm7
6300
vpsrld $31,%ymm13,%ymm9
6301
vpand %ymm4,%ymm5,%ymm5
6302
vpaddd %ymm13,%ymm13,%ymm13
6303
6304
vpslld $30,%ymm4,%ymm6
6305
vpaddd %ymm5,%ymm2,%ymm2
6306
6307
vpsrld $2,%ymm4,%ymm4
6308
vpaddd %ymm7,%ymm2,%ymm2
6309
vpor %ymm9,%ymm13,%ymm13
6310
vpor %ymm6,%ymm4,%ymm4
6311
vpxor %ymm11,%ymm14,%ymm14
6312
vmovdqa 448-256-128(%rbx),%ymm11
6313
6314
vpaddd %ymm15,%ymm1,%ymm1
6315
vpslld $5,%ymm2,%ymm7
6316
vpand %ymm4,%ymm0,%ymm6
6317
vpxor 128-128(%rax),%ymm14,%ymm14
6318
6319
vpaddd %ymm6,%ymm1,%ymm1
6320
vpsrld $27,%ymm2,%ymm8
6321
vpxor %ymm4,%ymm0,%ymm5
6322
vpxor %ymm11,%ymm14,%ymm14
6323
6324
vmovdqu %ymm13,352-256-128(%rbx)
6325
vpaddd %ymm13,%ymm1,%ymm1
6326
vpor %ymm8,%ymm7,%ymm7
6327
vpsrld $31,%ymm14,%ymm9
6328
vpand %ymm3,%ymm5,%ymm5
6329
vpaddd %ymm14,%ymm14,%ymm14
6330
6331
vpslld $30,%ymm3,%ymm6
6332
vpaddd %ymm5,%ymm1,%ymm1
6333
6334
vpsrld $2,%ymm3,%ymm3
6335
vpaddd %ymm7,%ymm1,%ymm1
6336
vpor %ymm9,%ymm14,%ymm14
6337
vpor %ymm6,%ymm3,%ymm3
6338
vpxor %ymm12,%ymm10,%ymm10
6339
vmovdqa 480-256-128(%rbx),%ymm12
6340
6341
vpaddd %ymm15,%ymm0,%ymm0
6342
vpslld $5,%ymm1,%ymm7
6343
vpand %ymm3,%ymm4,%ymm6
6344
vpxor 160-128(%rax),%ymm10,%ymm10
6345
6346
vpaddd %ymm6,%ymm0,%ymm0
6347
vpsrld $27,%ymm1,%ymm8
6348
vpxor %ymm3,%ymm4,%ymm5
6349
vpxor %ymm12,%ymm10,%ymm10
6350
6351
vmovdqu %ymm14,384-256-128(%rbx)
6352
vpaddd %ymm14,%ymm0,%ymm0
6353
vpor %ymm8,%ymm7,%ymm7
6354
vpsrld $31,%ymm10,%ymm9
6355
vpand %ymm2,%ymm5,%ymm5
6356
vpaddd %ymm10,%ymm10,%ymm10
6357
6358
vpslld $30,%ymm2,%ymm6
6359
vpaddd %ymm5,%ymm0,%ymm0
6360
6361
vpsrld $2,%ymm2,%ymm2
6362
vpaddd %ymm7,%ymm0,%ymm0
6363
vpor %ymm9,%ymm10,%ymm10
6364
vpor %ymm6,%ymm2,%ymm2
6365
vpxor %ymm13,%ymm11,%ymm11
6366
vmovdqa 0-128(%rax),%ymm13
6367
6368
vpaddd %ymm15,%ymm4,%ymm4
6369
vpslld $5,%ymm0,%ymm7
6370
vpand %ymm2,%ymm3,%ymm6
6371
vpxor 192-128(%rax),%ymm11,%ymm11
6372
6373
vpaddd %ymm6,%ymm4,%ymm4
6374
vpsrld $27,%ymm0,%ymm8
6375
vpxor %ymm2,%ymm3,%ymm5
6376
vpxor %ymm13,%ymm11,%ymm11
6377
6378
vmovdqu %ymm10,416-256-128(%rbx)
6379
vpaddd %ymm10,%ymm4,%ymm4
6380
vpor %ymm8,%ymm7,%ymm7
6381
vpsrld $31,%ymm11,%ymm9
6382
vpand %ymm1,%ymm5,%ymm5
6383
vpaddd %ymm11,%ymm11,%ymm11
6384
6385
vpslld $30,%ymm1,%ymm6
6386
vpaddd %ymm5,%ymm4,%ymm4
6387
6388
vpsrld $2,%ymm1,%ymm1
6389
vpaddd %ymm7,%ymm4,%ymm4
6390
vpor %ymm9,%ymm11,%ymm11
6391
vpor %ymm6,%ymm1,%ymm1
6392
vpxor %ymm14,%ymm12,%ymm12
6393
vmovdqa 32-128(%rax),%ymm14
6394
6395
vpaddd %ymm15,%ymm3,%ymm3
6396
vpslld $5,%ymm4,%ymm7
6397
vpand %ymm1,%ymm2,%ymm6
6398
vpxor 224-128(%rax),%ymm12,%ymm12
6399
6400
vpaddd %ymm6,%ymm3,%ymm3
6401
vpsrld $27,%ymm4,%ymm8
6402
vpxor %ymm1,%ymm2,%ymm5
6403
vpxor %ymm14,%ymm12,%ymm12
6404
6405
vmovdqu %ymm11,448-256-128(%rbx)
6406
vpaddd %ymm11,%ymm3,%ymm3
6407
vpor %ymm8,%ymm7,%ymm7
6408
vpsrld $31,%ymm12,%ymm9
6409
vpand %ymm0,%ymm5,%ymm5
6410
vpaddd %ymm12,%ymm12,%ymm12
6411
6412
vpslld $30,%ymm0,%ymm6
6413
vpaddd %ymm5,%ymm3,%ymm3
6414
6415
vpsrld $2,%ymm0,%ymm0
6416
vpaddd %ymm7,%ymm3,%ymm3
6417
vpor %ymm9,%ymm12,%ymm12
6418
vpor %ymm6,%ymm0,%ymm0
6419
vpxor %ymm10,%ymm13,%ymm13
6420
vmovdqa 64-128(%rax),%ymm10
6421
6422
vpaddd %ymm15,%ymm2,%ymm2
6423
vpslld $5,%ymm3,%ymm7
6424
vpand %ymm0,%ymm1,%ymm6
6425
vpxor 256-256-128(%rbx),%ymm13,%ymm13
6426
6427
vpaddd %ymm6,%ymm2,%ymm2
6428
vpsrld $27,%ymm3,%ymm8
6429
vpxor %ymm0,%ymm1,%ymm5
6430
vpxor %ymm10,%ymm13,%ymm13
6431
6432
vmovdqu %ymm12,480-256-128(%rbx)
6433
vpaddd %ymm12,%ymm2,%ymm2
6434
vpor %ymm8,%ymm7,%ymm7
6435
vpsrld $31,%ymm13,%ymm9
6436
vpand %ymm4,%ymm5,%ymm5
6437
vpaddd %ymm13,%ymm13,%ymm13
6438
6439
vpslld $30,%ymm4,%ymm6
6440
vpaddd %ymm5,%ymm2,%ymm2
6441
6442
vpsrld $2,%ymm4,%ymm4
6443
vpaddd %ymm7,%ymm2,%ymm2
6444
vpor %ymm9,%ymm13,%ymm13
6445
vpor %ymm6,%ymm4,%ymm4
6446
vpxor %ymm11,%ymm14,%ymm14
6447
vmovdqa 96-128(%rax),%ymm11
6448
6449
vpaddd %ymm15,%ymm1,%ymm1
6450
vpslld $5,%ymm2,%ymm7
6451
vpand %ymm4,%ymm0,%ymm6
6452
vpxor 288-256-128(%rbx),%ymm14,%ymm14
6453
6454
vpaddd %ymm6,%ymm1,%ymm1
6455
vpsrld $27,%ymm2,%ymm8
6456
vpxor %ymm4,%ymm0,%ymm5
6457
vpxor %ymm11,%ymm14,%ymm14
6458
6459
vmovdqu %ymm13,0-128(%rax)
6460
vpaddd %ymm13,%ymm1,%ymm1
6461
vpor %ymm8,%ymm7,%ymm7
6462
vpsrld $31,%ymm14,%ymm9
6463
vpand %ymm3,%ymm5,%ymm5
6464
vpaddd %ymm14,%ymm14,%ymm14
6465
6466
vpslld $30,%ymm3,%ymm6
6467
vpaddd %ymm5,%ymm1,%ymm1
6468
6469
vpsrld $2,%ymm3,%ymm3
6470
vpaddd %ymm7,%ymm1,%ymm1
6471
vpor %ymm9,%ymm14,%ymm14
6472
vpor %ymm6,%ymm3,%ymm3
6473
vpxor %ymm12,%ymm10,%ymm10
6474
vmovdqa 128-128(%rax),%ymm12
6475
6476
vpaddd %ymm15,%ymm0,%ymm0
6477
vpslld $5,%ymm1,%ymm7
6478
vpand %ymm3,%ymm4,%ymm6
6479
vpxor 320-256-128(%rbx),%ymm10,%ymm10
6480
6481
vpaddd %ymm6,%ymm0,%ymm0
6482
vpsrld $27,%ymm1,%ymm8
6483
vpxor %ymm3,%ymm4,%ymm5
6484
vpxor %ymm12,%ymm10,%ymm10
6485
6486
vmovdqu %ymm14,32-128(%rax)
6487
vpaddd %ymm14,%ymm0,%ymm0
6488
vpor %ymm8,%ymm7,%ymm7
6489
vpsrld $31,%ymm10,%ymm9
6490
vpand %ymm2,%ymm5,%ymm5
6491
vpaddd %ymm10,%ymm10,%ymm10
6492
6493
vpslld $30,%ymm2,%ymm6
6494
vpaddd %ymm5,%ymm0,%ymm0
6495
6496
vpsrld $2,%ymm2,%ymm2
6497
vpaddd %ymm7,%ymm0,%ymm0
6498
vpor %ymm9,%ymm10,%ymm10
6499
vpor %ymm6,%ymm2,%ymm2
6500
vpxor %ymm13,%ymm11,%ymm11
6501
vmovdqa 160-128(%rax),%ymm13
6502
6503
vpaddd %ymm15,%ymm4,%ymm4
6504
vpslld $5,%ymm0,%ymm7
6505
vpand %ymm2,%ymm3,%ymm6
6506
vpxor 352-256-128(%rbx),%ymm11,%ymm11
6507
6508
vpaddd %ymm6,%ymm4,%ymm4
6509
vpsrld $27,%ymm0,%ymm8
6510
vpxor %ymm2,%ymm3,%ymm5
6511
vpxor %ymm13,%ymm11,%ymm11
6512
6513
vmovdqu %ymm10,64-128(%rax)
6514
vpaddd %ymm10,%ymm4,%ymm4
6515
vpor %ymm8,%ymm7,%ymm7
6516
vpsrld $31,%ymm11,%ymm9
6517
vpand %ymm1,%ymm5,%ymm5
6518
vpaddd %ymm11,%ymm11,%ymm11
6519
6520
vpslld $30,%ymm1,%ymm6
6521
vpaddd %ymm5,%ymm4,%ymm4
6522
6523
vpsrld $2,%ymm1,%ymm1
6524
vpaddd %ymm7,%ymm4,%ymm4
6525
vpor %ymm9,%ymm11,%ymm11
6526
vpor %ymm6,%ymm1,%ymm1
6527
vpxor %ymm14,%ymm12,%ymm12
6528
vmovdqa 192-128(%rax),%ymm14
6529
6530
vpaddd %ymm15,%ymm3,%ymm3
6531
vpslld $5,%ymm4,%ymm7
6532
vpand %ymm1,%ymm2,%ymm6
6533
vpxor 384-256-128(%rbx),%ymm12,%ymm12
6534
6535
vpaddd %ymm6,%ymm3,%ymm3
6536
vpsrld $27,%ymm4,%ymm8
6537
vpxor %ymm1,%ymm2,%ymm5
6538
vpxor %ymm14,%ymm12,%ymm12
6539
6540
vmovdqu %ymm11,96-128(%rax)
6541
vpaddd %ymm11,%ymm3,%ymm3
6542
vpor %ymm8,%ymm7,%ymm7
6543
vpsrld $31,%ymm12,%ymm9
6544
vpand %ymm0,%ymm5,%ymm5
6545
vpaddd %ymm12,%ymm12,%ymm12
6546
6547
vpslld $30,%ymm0,%ymm6
6548
vpaddd %ymm5,%ymm3,%ymm3
6549
6550
vpsrld $2,%ymm0,%ymm0
6551
vpaddd %ymm7,%ymm3,%ymm3
6552
vpor %ymm9,%ymm12,%ymm12
6553
vpor %ymm6,%ymm0,%ymm0
6554
vpxor %ymm10,%ymm13,%ymm13
6555
vmovdqa 224-128(%rax),%ymm10
6556
6557
vpaddd %ymm15,%ymm2,%ymm2
6558
vpslld $5,%ymm3,%ymm7
6559
vpand %ymm0,%ymm1,%ymm6
6560
vpxor 416-256-128(%rbx),%ymm13,%ymm13
6561
6562
vpaddd %ymm6,%ymm2,%ymm2
6563
vpsrld $27,%ymm3,%ymm8
6564
vpxor %ymm0,%ymm1,%ymm5
6565
vpxor %ymm10,%ymm13,%ymm13
6566
6567
vmovdqu %ymm12,128-128(%rax)
6568
vpaddd %ymm12,%ymm2,%ymm2
6569
vpor %ymm8,%ymm7,%ymm7
6570
vpsrld $31,%ymm13,%ymm9
6571
vpand %ymm4,%ymm5,%ymm5
6572
vpaddd %ymm13,%ymm13,%ymm13
6573
6574
vpslld $30,%ymm4,%ymm6
6575
vpaddd %ymm5,%ymm2,%ymm2
6576
6577
vpsrld $2,%ymm4,%ymm4
6578
vpaddd %ymm7,%ymm2,%ymm2
6579
vpor %ymm9,%ymm13,%ymm13
6580
vpor %ymm6,%ymm4,%ymm4
6581
vpxor %ymm11,%ymm14,%ymm14
6582
vmovdqa 256-256-128(%rbx),%ymm11
6583
6584
vpaddd %ymm15,%ymm1,%ymm1
6585
vpslld $5,%ymm2,%ymm7
6586
vpand %ymm4,%ymm0,%ymm6
6587
vpxor 448-256-128(%rbx),%ymm14,%ymm14
6588
6589
vpaddd %ymm6,%ymm1,%ymm1
6590
vpsrld $27,%ymm2,%ymm8
6591
vpxor %ymm4,%ymm0,%ymm5
6592
vpxor %ymm11,%ymm14,%ymm14
6593
6594
vmovdqu %ymm13,160-128(%rax)
6595
vpaddd %ymm13,%ymm1,%ymm1
6596
vpor %ymm8,%ymm7,%ymm7
6597
vpsrld $31,%ymm14,%ymm9
6598
vpand %ymm3,%ymm5,%ymm5
6599
vpaddd %ymm14,%ymm14,%ymm14
6600
6601
vpslld $30,%ymm3,%ymm6
6602
vpaddd %ymm5,%ymm1,%ymm1
6603
6604
vpsrld $2,%ymm3,%ymm3
6605
vpaddd %ymm7,%ymm1,%ymm1
6606
vpor %ymm9,%ymm14,%ymm14
6607
vpor %ymm6,%ymm3,%ymm3
6608
vpxor %ymm12,%ymm10,%ymm10
6609
vmovdqa 288-256-128(%rbx),%ymm12
6610
6611
vpaddd %ymm15,%ymm0,%ymm0
6612
vpslld $5,%ymm1,%ymm7
6613
vpand %ymm3,%ymm4,%ymm6
6614
vpxor 480-256-128(%rbx),%ymm10,%ymm10
6615
6616
vpaddd %ymm6,%ymm0,%ymm0
6617
vpsrld $27,%ymm1,%ymm8
6618
vpxor %ymm3,%ymm4,%ymm5
6619
vpxor %ymm12,%ymm10,%ymm10
6620
6621
vmovdqu %ymm14,192-128(%rax)
6622
vpaddd %ymm14,%ymm0,%ymm0
6623
vpor %ymm8,%ymm7,%ymm7
6624
vpsrld $31,%ymm10,%ymm9
6625
vpand %ymm2,%ymm5,%ymm5
6626
vpaddd %ymm10,%ymm10,%ymm10
6627
6628
vpslld $30,%ymm2,%ymm6
6629
vpaddd %ymm5,%ymm0,%ymm0
6630
6631
vpsrld $2,%ymm2,%ymm2
6632
vpaddd %ymm7,%ymm0,%ymm0
6633
vpor %ymm9,%ymm10,%ymm10
6634
vpor %ymm6,%ymm2,%ymm2
6635
vpxor %ymm13,%ymm11,%ymm11
6636
vmovdqa 320-256-128(%rbx),%ymm13
6637
6638
vpaddd %ymm15,%ymm4,%ymm4
6639
vpslld $5,%ymm0,%ymm7
6640
vpand %ymm2,%ymm3,%ymm6
6641
vpxor 0-128(%rax),%ymm11,%ymm11
6642
6643
vpaddd %ymm6,%ymm4,%ymm4
6644
vpsrld $27,%ymm0,%ymm8
6645
vpxor %ymm2,%ymm3,%ymm5
6646
vpxor %ymm13,%ymm11,%ymm11
6647
6648
vmovdqu %ymm10,224-128(%rax)
6649
vpaddd %ymm10,%ymm4,%ymm4
6650
vpor %ymm8,%ymm7,%ymm7
6651
vpsrld $31,%ymm11,%ymm9
6652
vpand %ymm1,%ymm5,%ymm5
6653
vpaddd %ymm11,%ymm11,%ymm11
6654
6655
vpslld $30,%ymm1,%ymm6
6656
vpaddd %ymm5,%ymm4,%ymm4
6657
6658
vpsrld $2,%ymm1,%ymm1
6659
vpaddd %ymm7,%ymm4,%ymm4
6660
vpor %ymm9,%ymm11,%ymm11
6661
vpor %ymm6,%ymm1,%ymm1
6662
vpxor %ymm14,%ymm12,%ymm12
6663
vmovdqa 352-256-128(%rbx),%ymm14
6664
6665
vpaddd %ymm15,%ymm3,%ymm3
6666
vpslld $5,%ymm4,%ymm7
6667
vpand %ymm1,%ymm2,%ymm6
6668
vpxor 32-128(%rax),%ymm12,%ymm12
6669
6670
vpaddd %ymm6,%ymm3,%ymm3
6671
vpsrld $27,%ymm4,%ymm8
6672
vpxor %ymm1,%ymm2,%ymm5
6673
vpxor %ymm14,%ymm12,%ymm12
6674
6675
vmovdqu %ymm11,256-256-128(%rbx)
6676
vpaddd %ymm11,%ymm3,%ymm3
6677
vpor %ymm8,%ymm7,%ymm7
6678
vpsrld $31,%ymm12,%ymm9
6679
vpand %ymm0,%ymm5,%ymm5
6680
vpaddd %ymm12,%ymm12,%ymm12
6681
6682
vpslld $30,%ymm0,%ymm6
6683
vpaddd %ymm5,%ymm3,%ymm3
6684
6685
vpsrld $2,%ymm0,%ymm0
6686
vpaddd %ymm7,%ymm3,%ymm3
6687
vpor %ymm9,%ymm12,%ymm12
6688
vpor %ymm6,%ymm0,%ymm0
6689
vpxor %ymm10,%ymm13,%ymm13
6690
vmovdqa 384-256-128(%rbx),%ymm10
6691
6692
vpaddd %ymm15,%ymm2,%ymm2
6693
vpslld $5,%ymm3,%ymm7
6694
vpand %ymm0,%ymm1,%ymm6
6695
vpxor 64-128(%rax),%ymm13,%ymm13
6696
6697
vpaddd %ymm6,%ymm2,%ymm2
6698
vpsrld $27,%ymm3,%ymm8
6699
vpxor %ymm0,%ymm1,%ymm5
6700
vpxor %ymm10,%ymm13,%ymm13
6701
6702
vmovdqu %ymm12,288-256-128(%rbx)
6703
vpaddd %ymm12,%ymm2,%ymm2
6704
vpor %ymm8,%ymm7,%ymm7
6705
vpsrld $31,%ymm13,%ymm9
6706
vpand %ymm4,%ymm5,%ymm5
6707
vpaddd %ymm13,%ymm13,%ymm13
6708
6709
vpslld $30,%ymm4,%ymm6
6710
vpaddd %ymm5,%ymm2,%ymm2
6711
6712
vpsrld $2,%ymm4,%ymm4
6713
vpaddd %ymm7,%ymm2,%ymm2
6714
vpor %ymm9,%ymm13,%ymm13
6715
vpor %ymm6,%ymm4,%ymm4
6716
vpxor %ymm11,%ymm14,%ymm14
6717
vmovdqa 416-256-128(%rbx),%ymm11
6718
6719
vpaddd %ymm15,%ymm1,%ymm1
6720
vpslld $5,%ymm2,%ymm7
6721
vpand %ymm4,%ymm0,%ymm6
6722
vpxor 96-128(%rax),%ymm14,%ymm14
6723
6724
vpaddd %ymm6,%ymm1,%ymm1
6725
vpsrld $27,%ymm2,%ymm8
6726
vpxor %ymm4,%ymm0,%ymm5
6727
vpxor %ymm11,%ymm14,%ymm14
6728
6729
vmovdqu %ymm13,320-256-128(%rbx)
6730
vpaddd %ymm13,%ymm1,%ymm1
6731
vpor %ymm8,%ymm7,%ymm7
6732
vpsrld $31,%ymm14,%ymm9
6733
vpand %ymm3,%ymm5,%ymm5
6734
vpaddd %ymm14,%ymm14,%ymm14
6735
6736
vpslld $30,%ymm3,%ymm6
6737
vpaddd %ymm5,%ymm1,%ymm1
6738
6739
vpsrld $2,%ymm3,%ymm3
6740
vpaddd %ymm7,%ymm1,%ymm1
6741
vpor %ymm9,%ymm14,%ymm14
6742
vpor %ymm6,%ymm3,%ymm3
6743
vpxor %ymm12,%ymm10,%ymm10
6744
vmovdqa 448-256-128(%rbx),%ymm12
6745
6746
vpaddd %ymm15,%ymm0,%ymm0
6747
vpslld $5,%ymm1,%ymm7
6748
vpand %ymm3,%ymm4,%ymm6
6749
vpxor 128-128(%rax),%ymm10,%ymm10
6750
6751
vpaddd %ymm6,%ymm0,%ymm0
6752
vpsrld $27,%ymm1,%ymm8
6753
vpxor %ymm3,%ymm4,%ymm5
6754
vpxor %ymm12,%ymm10,%ymm10
6755
6756
vmovdqu %ymm14,352-256-128(%rbx)
6757
vpaddd %ymm14,%ymm0,%ymm0
6758
vpor %ymm8,%ymm7,%ymm7
6759
vpsrld $31,%ymm10,%ymm9
6760
vpand %ymm2,%ymm5,%ymm5
6761
vpaddd %ymm10,%ymm10,%ymm10
6762
6763
vpslld $30,%ymm2,%ymm6
6764
vpaddd %ymm5,%ymm0,%ymm0
6765
6766
vpsrld $2,%ymm2,%ymm2
6767
vpaddd %ymm7,%ymm0,%ymm0
6768
vpor %ymm9,%ymm10,%ymm10
6769
vpor %ymm6,%ymm2,%ymm2
6770
vmovdqa 64(%rbp),%ymm15
6771
vpxor %ymm13,%ymm11,%ymm11
6772
vmovdqa 480-256-128(%rbx),%ymm13
6773
6774
vpslld $5,%ymm0,%ymm7
6775
vpaddd %ymm15,%ymm4,%ymm4
6776
vpxor %ymm1,%ymm3,%ymm5
6777
vmovdqa %ymm10,384-256-128(%rbx)
6778
vpaddd %ymm10,%ymm4,%ymm4
6779
vpxor 160-128(%rax),%ymm11,%ymm11
6780
vpsrld $27,%ymm0,%ymm8
6781
vpxor %ymm2,%ymm5,%ymm5
6782
vpxor %ymm13,%ymm11,%ymm11
6783
6784
vpslld $30,%ymm1,%ymm6
6785
vpor %ymm8,%ymm7,%ymm7
6786
vpaddd %ymm5,%ymm4,%ymm4
6787
vpsrld $31,%ymm11,%ymm9
6788
vpaddd %ymm11,%ymm11,%ymm11
6789
6790
vpsrld $2,%ymm1,%ymm1
6791
vpaddd %ymm7,%ymm4,%ymm4
6792
vpor %ymm9,%ymm11,%ymm11
6793
vpor %ymm6,%ymm1,%ymm1
6794
vpxor %ymm14,%ymm12,%ymm12
6795
vmovdqa 0-128(%rax),%ymm14
6796
6797
vpslld $5,%ymm4,%ymm7
6798
vpaddd %ymm15,%ymm3,%ymm3
6799
vpxor %ymm0,%ymm2,%ymm5
6800
vmovdqa %ymm11,416-256-128(%rbx)
6801
vpaddd %ymm11,%ymm3,%ymm3
6802
vpxor 192-128(%rax),%ymm12,%ymm12
6803
vpsrld $27,%ymm4,%ymm8
6804
vpxor %ymm1,%ymm5,%ymm5
6805
vpxor %ymm14,%ymm12,%ymm12
6806
6807
vpslld $30,%ymm0,%ymm6
6808
vpor %ymm8,%ymm7,%ymm7
6809
vpaddd %ymm5,%ymm3,%ymm3
6810
vpsrld $31,%ymm12,%ymm9
6811
vpaddd %ymm12,%ymm12,%ymm12
6812
6813
vpsrld $2,%ymm0,%ymm0
6814
vpaddd %ymm7,%ymm3,%ymm3
6815
vpor %ymm9,%ymm12,%ymm12
6816
vpor %ymm6,%ymm0,%ymm0
6817
vpxor %ymm10,%ymm13,%ymm13
6818
vmovdqa 32-128(%rax),%ymm10
6819
6820
vpslld $5,%ymm3,%ymm7
6821
vpaddd %ymm15,%ymm2,%ymm2
6822
vpxor %ymm4,%ymm1,%ymm5
6823
vmovdqa %ymm12,448-256-128(%rbx)
6824
vpaddd %ymm12,%ymm2,%ymm2
6825
vpxor 224-128(%rax),%ymm13,%ymm13
6826
vpsrld $27,%ymm3,%ymm8
6827
vpxor %ymm0,%ymm5,%ymm5
6828
vpxor %ymm10,%ymm13,%ymm13
6829
6830
vpslld $30,%ymm4,%ymm6
6831
vpor %ymm8,%ymm7,%ymm7
6832
vpaddd %ymm5,%ymm2,%ymm2
6833
vpsrld $31,%ymm13,%ymm9
6834
vpaddd %ymm13,%ymm13,%ymm13
6835
6836
vpsrld $2,%ymm4,%ymm4
6837
vpaddd %ymm7,%ymm2,%ymm2
6838
vpor %ymm9,%ymm13,%ymm13
6839
vpor %ymm6,%ymm4,%ymm4
6840
vpxor %ymm11,%ymm14,%ymm14
6841
vmovdqa 64-128(%rax),%ymm11
6842
6843
vpslld $5,%ymm2,%ymm7
6844
vpaddd %ymm15,%ymm1,%ymm1
6845
vpxor %ymm3,%ymm0,%ymm5
6846
vmovdqa %ymm13,480-256-128(%rbx)
6847
vpaddd %ymm13,%ymm1,%ymm1
6848
vpxor 256-256-128(%rbx),%ymm14,%ymm14
6849
vpsrld $27,%ymm2,%ymm8
6850
vpxor %ymm4,%ymm5,%ymm5
6851
vpxor %ymm11,%ymm14,%ymm14
6852
6853
vpslld $30,%ymm3,%ymm6
6854
vpor %ymm8,%ymm7,%ymm7
6855
vpaddd %ymm5,%ymm1,%ymm1
6856
vpsrld $31,%ymm14,%ymm9
6857
vpaddd %ymm14,%ymm14,%ymm14
6858
6859
vpsrld $2,%ymm3,%ymm3
6860
vpaddd %ymm7,%ymm1,%ymm1
6861
vpor %ymm9,%ymm14,%ymm14
6862
vpor %ymm6,%ymm3,%ymm3
6863
vpxor %ymm12,%ymm10,%ymm10
6864
vmovdqa 96-128(%rax),%ymm12
6865
6866
vpslld $5,%ymm1,%ymm7
6867
vpaddd %ymm15,%ymm0,%ymm0
6868
vpxor %ymm2,%ymm4,%ymm5
6869
vmovdqa %ymm14,0-128(%rax)
6870
vpaddd %ymm14,%ymm0,%ymm0
6871
vpxor 288-256-128(%rbx),%ymm10,%ymm10
6872
vpsrld $27,%ymm1,%ymm8
6873
vpxor %ymm3,%ymm5,%ymm5
6874
vpxor %ymm12,%ymm10,%ymm10
6875
6876
vpslld $30,%ymm2,%ymm6
6877
vpor %ymm8,%ymm7,%ymm7
6878
vpaddd %ymm5,%ymm0,%ymm0
6879
vpsrld $31,%ymm10,%ymm9
6880
vpaddd %ymm10,%ymm10,%ymm10
6881
6882
vpsrld $2,%ymm2,%ymm2
6883
vpaddd %ymm7,%ymm0,%ymm0
6884
vpor %ymm9,%ymm10,%ymm10
6885
vpor %ymm6,%ymm2,%ymm2
6886
vpxor %ymm13,%ymm11,%ymm11
6887
vmovdqa 128-128(%rax),%ymm13
6888
6889
vpslld $5,%ymm0,%ymm7
6890
vpaddd %ymm15,%ymm4,%ymm4
6891
vpxor %ymm1,%ymm3,%ymm5
6892
vmovdqa %ymm10,32-128(%rax)
6893
vpaddd %ymm10,%ymm4,%ymm4
6894
vpxor 320-256-128(%rbx),%ymm11,%ymm11
6895
vpsrld $27,%ymm0,%ymm8
6896
vpxor %ymm2,%ymm5,%ymm5
6897
vpxor %ymm13,%ymm11,%ymm11
6898
6899
vpslld $30,%ymm1,%ymm6
6900
vpor %ymm8,%ymm7,%ymm7
6901
vpaddd %ymm5,%ymm4,%ymm4
6902
vpsrld $31,%ymm11,%ymm9
6903
vpaddd %ymm11,%ymm11,%ymm11
6904
6905
vpsrld $2,%ymm1,%ymm1
6906
vpaddd %ymm7,%ymm4,%ymm4
6907
vpor %ymm9,%ymm11,%ymm11
6908
vpor %ymm6,%ymm1,%ymm1
6909
vpxor %ymm14,%ymm12,%ymm12
6910
vmovdqa 160-128(%rax),%ymm14
6911
6912
vpslld $5,%ymm4,%ymm7
6913
vpaddd %ymm15,%ymm3,%ymm3
6914
vpxor %ymm0,%ymm2,%ymm5
6915
vmovdqa %ymm11,64-128(%rax)
6916
vpaddd %ymm11,%ymm3,%ymm3
6917
vpxor 352-256-128(%rbx),%ymm12,%ymm12
6918
vpsrld $27,%ymm4,%ymm8
6919
vpxor %ymm1,%ymm5,%ymm5
6920
vpxor %ymm14,%ymm12,%ymm12
6921
6922
vpslld $30,%ymm0,%ymm6
6923
vpor %ymm8,%ymm7,%ymm7
6924
vpaddd %ymm5,%ymm3,%ymm3
6925
vpsrld $31,%ymm12,%ymm9
6926
vpaddd %ymm12,%ymm12,%ymm12
6927
6928
vpsrld $2,%ymm0,%ymm0
6929
vpaddd %ymm7,%ymm3,%ymm3
6930
vpor %ymm9,%ymm12,%ymm12
6931
vpor %ymm6,%ymm0,%ymm0
6932
vpxor %ymm10,%ymm13,%ymm13
6933
vmovdqa 192-128(%rax),%ymm10
6934
6935
vpslld $5,%ymm3,%ymm7
6936
vpaddd %ymm15,%ymm2,%ymm2
6937
vpxor %ymm4,%ymm1,%ymm5
6938
vmovdqa %ymm12,96-128(%rax)
6939
vpaddd %ymm12,%ymm2,%ymm2
6940
vpxor 384-256-128(%rbx),%ymm13,%ymm13
6941
vpsrld $27,%ymm3,%ymm8
6942
vpxor %ymm0,%ymm5,%ymm5
6943
vpxor %ymm10,%ymm13,%ymm13
6944
6945
vpslld $30,%ymm4,%ymm6
6946
vpor %ymm8,%ymm7,%ymm7
6947
vpaddd %ymm5,%ymm2,%ymm2
6948
vpsrld $31,%ymm13,%ymm9
6949
vpaddd %ymm13,%ymm13,%ymm13
6950
6951
vpsrld $2,%ymm4,%ymm4
6952
vpaddd %ymm7,%ymm2,%ymm2
6953
vpor %ymm9,%ymm13,%ymm13
6954
vpor %ymm6,%ymm4,%ymm4
6955
vpxor %ymm11,%ymm14,%ymm14
6956
vmovdqa 224-128(%rax),%ymm11
6957
6958
vpslld $5,%ymm2,%ymm7
6959
vpaddd %ymm15,%ymm1,%ymm1
6960
vpxor %ymm3,%ymm0,%ymm5
6961
vmovdqa %ymm13,128-128(%rax)
6962
vpaddd %ymm13,%ymm1,%ymm1
6963
vpxor 416-256-128(%rbx),%ymm14,%ymm14
6964
vpsrld $27,%ymm2,%ymm8
6965
vpxor %ymm4,%ymm5,%ymm5
6966
vpxor %ymm11,%ymm14,%ymm14
6967
6968
vpslld $30,%ymm3,%ymm6
6969
vpor %ymm8,%ymm7,%ymm7
6970
vpaddd %ymm5,%ymm1,%ymm1
6971
vpsrld $31,%ymm14,%ymm9
6972
vpaddd %ymm14,%ymm14,%ymm14
6973
6974
vpsrld $2,%ymm3,%ymm3
6975
vpaddd %ymm7,%ymm1,%ymm1
6976
vpor %ymm9,%ymm14,%ymm14
6977
vpor %ymm6,%ymm3,%ymm3
6978
vpxor %ymm12,%ymm10,%ymm10
6979
vmovdqa 256-256-128(%rbx),%ymm12
6980
6981
vpslld $5,%ymm1,%ymm7
6982
vpaddd %ymm15,%ymm0,%ymm0
6983
vpxor %ymm2,%ymm4,%ymm5
6984
vmovdqa %ymm14,160-128(%rax)
6985
vpaddd %ymm14,%ymm0,%ymm0
6986
vpxor 448-256-128(%rbx),%ymm10,%ymm10
6987
vpsrld $27,%ymm1,%ymm8
6988
vpxor %ymm3,%ymm5,%ymm5
6989
vpxor %ymm12,%ymm10,%ymm10
6990
6991
vpslld $30,%ymm2,%ymm6
6992
vpor %ymm8,%ymm7,%ymm7
6993
vpaddd %ymm5,%ymm0,%ymm0
6994
vpsrld $31,%ymm10,%ymm9
6995
vpaddd %ymm10,%ymm10,%ymm10
6996
6997
vpsrld $2,%ymm2,%ymm2
6998
vpaddd %ymm7,%ymm0,%ymm0
6999
vpor %ymm9,%ymm10,%ymm10
7000
vpor %ymm6,%ymm2,%ymm2
7001
vpxor %ymm13,%ymm11,%ymm11
7002
vmovdqa 288-256-128(%rbx),%ymm13
7003
7004
vpslld $5,%ymm0,%ymm7
7005
vpaddd %ymm15,%ymm4,%ymm4
7006
vpxor %ymm1,%ymm3,%ymm5
7007
vmovdqa %ymm10,192-128(%rax)
7008
vpaddd %ymm10,%ymm4,%ymm4
7009
vpxor 480-256-128(%rbx),%ymm11,%ymm11
7010
vpsrld $27,%ymm0,%ymm8
7011
vpxor %ymm2,%ymm5,%ymm5
7012
vpxor %ymm13,%ymm11,%ymm11
7013
7014
vpslld $30,%ymm1,%ymm6
7015
vpor %ymm8,%ymm7,%ymm7
7016
vpaddd %ymm5,%ymm4,%ymm4
7017
vpsrld $31,%ymm11,%ymm9
7018
vpaddd %ymm11,%ymm11,%ymm11
7019
7020
vpsrld $2,%ymm1,%ymm1
7021
vpaddd %ymm7,%ymm4,%ymm4
7022
vpor %ymm9,%ymm11,%ymm11
7023
vpor %ymm6,%ymm1,%ymm1
7024
vpxor %ymm14,%ymm12,%ymm12
7025
vmovdqa 320-256-128(%rbx),%ymm14
7026
7027
vpslld $5,%ymm4,%ymm7
7028
vpaddd %ymm15,%ymm3,%ymm3
7029
vpxor %ymm0,%ymm2,%ymm5
7030
vmovdqa %ymm11,224-128(%rax)
7031
vpaddd %ymm11,%ymm3,%ymm3
7032
vpxor 0-128(%rax),%ymm12,%ymm12
7033
vpsrld $27,%ymm4,%ymm8
7034
vpxor %ymm1,%ymm5,%ymm5
7035
vpxor %ymm14,%ymm12,%ymm12
7036
7037
vpslld $30,%ymm0,%ymm6
7038
vpor %ymm8,%ymm7,%ymm7
7039
vpaddd %ymm5,%ymm3,%ymm3
7040
vpsrld $31,%ymm12,%ymm9
7041
vpaddd %ymm12,%ymm12,%ymm12
7042
7043
vpsrld $2,%ymm0,%ymm0
7044
vpaddd %ymm7,%ymm3,%ymm3
7045
vpor %ymm9,%ymm12,%ymm12
7046
vpor %ymm6,%ymm0,%ymm0
7047
vpxor %ymm10,%ymm13,%ymm13
7048
vmovdqa 352-256-128(%rbx),%ymm10
7049
7050
vpslld $5,%ymm3,%ymm7
7051
vpaddd %ymm15,%ymm2,%ymm2
7052
vpxor %ymm4,%ymm1,%ymm5
7053
vpaddd %ymm12,%ymm2,%ymm2
7054
vpxor 32-128(%rax),%ymm13,%ymm13
7055
vpsrld $27,%ymm3,%ymm8
7056
vpxor %ymm0,%ymm5,%ymm5
7057
vpxor %ymm10,%ymm13,%ymm13
7058
7059
vpslld $30,%ymm4,%ymm6
7060
vpor %ymm8,%ymm7,%ymm7
7061
vpaddd %ymm5,%ymm2,%ymm2
7062
vpsrld $31,%ymm13,%ymm9
7063
vpaddd %ymm13,%ymm13,%ymm13
7064
7065
vpsrld $2,%ymm4,%ymm4
7066
vpaddd %ymm7,%ymm2,%ymm2
7067
vpor %ymm9,%ymm13,%ymm13
7068
vpor %ymm6,%ymm4,%ymm4
7069
vpxor %ymm11,%ymm14,%ymm14
7070
vmovdqa 384-256-128(%rbx),%ymm11
7071
7072
vpslld $5,%ymm2,%ymm7
7073
vpaddd %ymm15,%ymm1,%ymm1
7074
vpxor %ymm3,%ymm0,%ymm5
7075
vpaddd %ymm13,%ymm1,%ymm1
7076
vpxor 64-128(%rax),%ymm14,%ymm14
7077
vpsrld $27,%ymm2,%ymm8
7078
vpxor %ymm4,%ymm5,%ymm5
7079
vpxor %ymm11,%ymm14,%ymm14
7080
7081
vpslld $30,%ymm3,%ymm6
7082
vpor %ymm8,%ymm7,%ymm7
7083
vpaddd %ymm5,%ymm1,%ymm1
7084
vpsrld $31,%ymm14,%ymm9
7085
vpaddd %ymm14,%ymm14,%ymm14
7086
7087
vpsrld $2,%ymm3,%ymm3
7088
vpaddd %ymm7,%ymm1,%ymm1
7089
vpor %ymm9,%ymm14,%ymm14
7090
vpor %ymm6,%ymm3,%ymm3
7091
vpxor %ymm12,%ymm10,%ymm10
7092
vmovdqa 416-256-128(%rbx),%ymm12
7093
7094
vpslld $5,%ymm1,%ymm7
7095
vpaddd %ymm15,%ymm0,%ymm0
7096
vpxor %ymm2,%ymm4,%ymm5
7097
vpaddd %ymm14,%ymm0,%ymm0
7098
vpxor 96-128(%rax),%ymm10,%ymm10
7099
vpsrld $27,%ymm1,%ymm8
7100
vpxor %ymm3,%ymm5,%ymm5
7101
vpxor %ymm12,%ymm10,%ymm10
7102
7103
vpslld $30,%ymm2,%ymm6
7104
vpor %ymm8,%ymm7,%ymm7
7105
vpaddd %ymm5,%ymm0,%ymm0
7106
vpsrld $31,%ymm10,%ymm9
7107
vpaddd %ymm10,%ymm10,%ymm10
7108
7109
vpsrld $2,%ymm2,%ymm2
7110
vpaddd %ymm7,%ymm0,%ymm0
7111
vpor %ymm9,%ymm10,%ymm10
7112
vpor %ymm6,%ymm2,%ymm2
7113
vpxor %ymm13,%ymm11,%ymm11
7114
vmovdqa 448-256-128(%rbx),%ymm13
7115
7116
vpslld $5,%ymm0,%ymm7
7117
vpaddd %ymm15,%ymm4,%ymm4
7118
vpxor %ymm1,%ymm3,%ymm5
7119
vpaddd %ymm10,%ymm4,%ymm4
7120
vpxor 128-128(%rax),%ymm11,%ymm11
7121
vpsrld $27,%ymm0,%ymm8
7122
vpxor %ymm2,%ymm5,%ymm5
7123
vpxor %ymm13,%ymm11,%ymm11
7124
7125
vpslld $30,%ymm1,%ymm6
7126
vpor %ymm8,%ymm7,%ymm7
7127
vpaddd %ymm5,%ymm4,%ymm4
7128
vpsrld $31,%ymm11,%ymm9
7129
vpaddd %ymm11,%ymm11,%ymm11
7130
7131
vpsrld $2,%ymm1,%ymm1
7132
vpaddd %ymm7,%ymm4,%ymm4
7133
vpor %ymm9,%ymm11,%ymm11
7134
vpor %ymm6,%ymm1,%ymm1
7135
vpxor %ymm14,%ymm12,%ymm12
7136
vmovdqa 480-256-128(%rbx),%ymm14
7137
7138
vpslld $5,%ymm4,%ymm7
7139
vpaddd %ymm15,%ymm3,%ymm3
7140
vpxor %ymm0,%ymm2,%ymm5
7141
vpaddd %ymm11,%ymm3,%ymm3
7142
vpxor 160-128(%rax),%ymm12,%ymm12
7143
vpsrld $27,%ymm4,%ymm8
7144
vpxor %ymm1,%ymm5,%ymm5
7145
vpxor %ymm14,%ymm12,%ymm12
7146
7147
vpslld $30,%ymm0,%ymm6
7148
vpor %ymm8,%ymm7,%ymm7
7149
vpaddd %ymm5,%ymm3,%ymm3
7150
vpsrld $31,%ymm12,%ymm9
7151
vpaddd %ymm12,%ymm12,%ymm12
7152
7153
vpsrld $2,%ymm0,%ymm0
7154
vpaddd %ymm7,%ymm3,%ymm3
7155
vpor %ymm9,%ymm12,%ymm12
7156
vpor %ymm6,%ymm0,%ymm0
7157
vpxor %ymm10,%ymm13,%ymm13
7158
vmovdqa 0-128(%rax),%ymm10
7159
7160
vpslld $5,%ymm3,%ymm7
7161
vpaddd %ymm15,%ymm2,%ymm2
7162
vpxor %ymm4,%ymm1,%ymm5
7163
vpaddd %ymm12,%ymm2,%ymm2
7164
vpxor 192-128(%rax),%ymm13,%ymm13
7165
vpsrld $27,%ymm3,%ymm8
7166
vpxor %ymm0,%ymm5,%ymm5
7167
vpxor %ymm10,%ymm13,%ymm13
7168
7169
vpslld $30,%ymm4,%ymm6
7170
vpor %ymm8,%ymm7,%ymm7
7171
vpaddd %ymm5,%ymm2,%ymm2
7172
vpsrld $31,%ymm13,%ymm9
7173
vpaddd %ymm13,%ymm13,%ymm13
7174
7175
vpsrld $2,%ymm4,%ymm4
7176
vpaddd %ymm7,%ymm2,%ymm2
7177
vpor %ymm9,%ymm13,%ymm13
7178
vpor %ymm6,%ymm4,%ymm4
7179
vpxor %ymm11,%ymm14,%ymm14
7180
vmovdqa 32-128(%rax),%ymm11
7181
7182
vpslld $5,%ymm2,%ymm7
7183
vpaddd %ymm15,%ymm1,%ymm1
7184
vpxor %ymm3,%ymm0,%ymm5
7185
vpaddd %ymm13,%ymm1,%ymm1
7186
vpxor 224-128(%rax),%ymm14,%ymm14
7187
vpsrld $27,%ymm2,%ymm8
7188
vpxor %ymm4,%ymm5,%ymm5
7189
vpxor %ymm11,%ymm14,%ymm14
7190
7191
vpslld $30,%ymm3,%ymm6
7192
vpor %ymm8,%ymm7,%ymm7
7193
vpaddd %ymm5,%ymm1,%ymm1
7194
vpsrld $31,%ymm14,%ymm9
7195
vpaddd %ymm14,%ymm14,%ymm14
7196
7197
vpsrld $2,%ymm3,%ymm3
7198
vpaddd %ymm7,%ymm1,%ymm1
7199
vpor %ymm9,%ymm14,%ymm14
7200
vpor %ymm6,%ymm3,%ymm3
7201
vpslld $5,%ymm1,%ymm7
7202
vpaddd %ymm15,%ymm0,%ymm0
7203
vpxor %ymm2,%ymm4,%ymm5
7204
7205
vpsrld $27,%ymm1,%ymm8
7206
vpaddd %ymm14,%ymm0,%ymm0
7207
vpxor %ymm3,%ymm5,%ymm5
7208
7209
vpslld $30,%ymm2,%ymm6
7210
vpor %ymm8,%ymm7,%ymm7
7211
vpaddd %ymm5,%ymm0,%ymm0
7212
7213
vpsrld $2,%ymm2,%ymm2
7214
vpaddd %ymm7,%ymm0,%ymm0
7215
vpor %ymm6,%ymm2,%ymm2
7216
movl $1,%ecx
7217
leaq 512(%rsp),%rbx
7218
cmpl 0(%rbx),%ecx
7219
cmovgeq %rbp,%r12
7220
cmpl 4(%rbx),%ecx
7221
cmovgeq %rbp,%r13
7222
cmpl 8(%rbx),%ecx
7223
cmovgeq %rbp,%r14
7224
cmpl 12(%rbx),%ecx
7225
cmovgeq %rbp,%r15
7226
cmpl 16(%rbx),%ecx
7227
cmovgeq %rbp,%r8
7228
cmpl 20(%rbx),%ecx
7229
cmovgeq %rbp,%r9
7230
cmpl 24(%rbx),%ecx
7231
cmovgeq %rbp,%r10
7232
cmpl 28(%rbx),%ecx
7233
cmovgeq %rbp,%r11
7234
vmovdqu (%rbx),%ymm5
7235
vpxor %ymm7,%ymm7,%ymm7
7236
vmovdqa %ymm5,%ymm6
7237
vpcmpgtd %ymm7,%ymm6,%ymm6
7238
vpaddd %ymm6,%ymm5,%ymm5
7239
7240
vpand %ymm6,%ymm0,%ymm0
7241
vpand %ymm6,%ymm1,%ymm1
7242
vpaddd 0(%rdi),%ymm0,%ymm0
7243
vpand %ymm6,%ymm2,%ymm2
7244
vpaddd 32(%rdi),%ymm1,%ymm1
7245
vpand %ymm6,%ymm3,%ymm3
7246
vpaddd 64(%rdi),%ymm2,%ymm2
7247
vpand %ymm6,%ymm4,%ymm4
7248
vpaddd 96(%rdi),%ymm3,%ymm3
7249
vpaddd 128(%rdi),%ymm4,%ymm4
7250
vmovdqu %ymm0,0(%rdi)
7251
vmovdqu %ymm1,32(%rdi)
7252
vmovdqu %ymm2,64(%rdi)
7253
vmovdqu %ymm3,96(%rdi)
7254
vmovdqu %ymm4,128(%rdi)
7255
7256
vmovdqu %ymm5,(%rbx)
7257
leaq 256+128(%rsp),%rbx
7258
vmovdqu 96(%rbp),%ymm9
7259
decl %edx
7260
jnz .Loop_avx2
7261
7262
7263
7264
7265
7266
7267
7268
.Ldone_avx2:
7269
movq 544(%rsp),%rax
7270
.cfi_def_cfa %rax,8
7271
vzeroupper
7272
movq -48(%rax),%r15
7273
.cfi_restore %r15
7274
movq -40(%rax),%r14
7275
.cfi_restore %r14
7276
movq -32(%rax),%r13
7277
.cfi_restore %r13
7278
movq -24(%rax),%r12
7279
.cfi_restore %r12
7280
movq -16(%rax),%rbp
7281
.cfi_restore %rbp
7282
movq -8(%rax),%rbx
7283
.cfi_restore %rbx
7284
leaq (%rax),%rsp
7285
.cfi_def_cfa_register %rsp
7286
.Lepilogue_avx2:
7287
.byte 0xf3,0xc3
7288
.cfi_endproc
7289
.size sha1_multi_block_avx2,.-sha1_multi_block_avx2
7290
.section .rodata
7291
.align 256
7292
.long 0x5a827999,0x5a827999,0x5a827999,0x5a827999
7293
.long 0x5a827999,0x5a827999,0x5a827999,0x5a827999
7294
K_XX_XX:
7295
.long 0x6ed9eba1,0x6ed9eba1,0x6ed9eba1,0x6ed9eba1
7296
.long 0x6ed9eba1,0x6ed9eba1,0x6ed9eba1,0x6ed9eba1
7297
.long 0x8f1bbcdc,0x8f1bbcdc,0x8f1bbcdc,0x8f1bbcdc
7298
.long 0x8f1bbcdc,0x8f1bbcdc,0x8f1bbcdc,0x8f1bbcdc
7299
.long 0xca62c1d6,0xca62c1d6,0xca62c1d6,0xca62c1d6
7300
.long 0xca62c1d6,0xca62c1d6,0xca62c1d6,0xca62c1d6
7301
.long 0x00010203,0x04050607,0x08090a0b,0x0c0d0e0f
7302
.long 0x00010203,0x04050607,0x08090a0b,0x0c0d0e0f
7303
.byte 0xf,0xe,0xd,0xc,0xb,0xa,0x9,0x8,0x7,0x6,0x5,0x4,0x3,0x2,0x1,0x0
7304
.byte 83,72,65,49,32,109,117,108,116,105,45,98,108,111,99,107,32,116,114,97,110,115,102,111,114,109,32,102,111,114,32,120,56,54,95,54,52,44,32,67,82,89,80,84,79,71,65,77,83,32,98,121,32,60,97,112,112,114,111,64,111,112,101,110,115,115,108,46,111,114,103,62,0
7305
.previous
7306
.section ".note.gnu.property", "a"
7307
.p2align 3
7308
.long 1f - 0f
7309
.long 4f - 1f
7310
.long 5
7311
0:
7312
# "GNU" encoded with .byte, since .asciz isn't supported
7313
# on Solaris.
7314
.byte 0x47
7315
.byte 0x4e
7316
.byte 0x55
7317
.byte 0
7318
1:
7319
.p2align 3
7320
.long 0xc0000002
7321
.long 3f - 2f
7322
2:
7323
.long 3
7324
3:
7325
.p2align 3
7326
4:
7327
7328