-rw-r--r-- 21020 lib25519-20240321/crypto_multiscalar/ed25519/amd64-maax-p3/ge25519_add.S raw
#include "crypto_asm_hidden.h"
#define mask63 CRYPTO_SHARED_NAMESPACE(mask63)
#define EC2D0 CRYPTO_SHARED_NAMESPACE(EC2D0)
#define EC2D1 CRYPTO_SHARED_NAMESPACE(EC2D1)
#define EC2D2 CRYPTO_SHARED_NAMESPACE(EC2D2)
#define EC2D3 CRYPTO_SHARED_NAMESPACE(EC2D3)
// ge25519_add
.p2align 5
ASM_HIDDEN _CRYPTO_NAMESPACE(ge25519_add)
.globl _CRYPTO_NAMESPACE(ge25519_add)
ASM_HIDDEN CRYPTO_NAMESPACE(ge25519_add)
.globl CRYPTO_NAMESPACE(ge25519_add)
_CRYPTO_NAMESPACE(ge25519_add):
CRYPTO_NAMESPACE(ge25519_add):
movq %rsp,%r11
andq $-32,%rsp
subq $216,%rsp
movq %r11,0(%rsp)
movq %r12,8(%rsp)
movq %r13,16(%rsp)
movq %r14,24(%rsp)
movq %r15,32(%rsp)
movq %rbx,40(%rsp)
movq %rbp,48(%rsp)
movq %rdx,%rcx
/* add p1p1 */
// load
movq 32(%rsi),%rdx
movq 40(%rsi),%r8
movq 48(%rsi),%r9
movq 56(%rsi),%rax
// copy
movq %rdx,%r10
movq %r8,%r11
movq %r9,%r12
movq %rax,%r13
// sub
subq 0(%rsi),%rdx
sbbq 8(%rsi),%r8
sbbq 16(%rsi),%r9
sbbq 24(%rsi),%rax
movq $0,%r14
movq $38,%r15
cmovae %r14,%r15
subq %r15,%rdx
sbbq %r14,%r8
sbbq %r14,%r9
sbbq %r14,%rax
cmovc %r15,%r14
subq %r14,%rdx
// add
addq 0(%rsi),%r10
adcq 8(%rsi),%r11
adcq 16(%rsi),%r12
adcq 24(%rsi),%r13
movq $0,%r14
movq $38,%r15
cmovae %r14,%r15
addq %r15,%r10
adcq %r14,%r11
adcq %r14,%r12
adcq %r14,%r13
cmovc %r15,%r14
addq %r14,%r10
// store
movq %rdx,56(%rsp)
movq %r8,64(%rsp)
movq %r9,72(%rsp)
movq %rax,80(%rsp)
// store
movq %r10,88(%rsp)
movq %r11,96(%rsp)
movq %r12,104(%rsp)
movq %r13,112(%rsp)
// load
movq 32(%rcx),%rdx
movq 40(%rcx),%r8
movq 48(%rcx),%r9
movq 56(%rcx),%rax
// copy
movq %rdx,%r10
movq %r8,%r11
movq %r9,%r12
movq %rax,%r13
// sub
subq 0(%rcx),%rdx
sbbq 8(%rcx),%r8
sbbq 16(%rcx),%r9
sbbq 24(%rcx),%rax
movq $0,%r14
movq $38,%r15
cmovae %r14,%r15
subq %r15,%rdx
sbbq %r14,%r8
sbbq %r14,%r9
sbbq %r14,%rax
cmovc %r15,%r14
subq %r14,%rdx
// add
addq 0(%rcx),%r10
adcq 8(%rcx),%r11
adcq 16(%rcx),%r12
adcq 24(%rcx),%r13
movq $0,%r14
movq $38,%r15
cmovae %r14,%r15
addq %r15,%r10
adcq %r14,%r11
adcq %r14,%r12
adcq %r14,%r13
cmovc %r15,%r14
addq %r14,%r10
// store
movq %rdx,120(%rsp)
movq %r8,128(%rsp)
movq %r9,136(%rsp)
movq %rax,144(%rsp)
// store
movq %r10,152(%rsp)
movq %r11,160(%rsp)
movq %r12,168(%rsp)
movq %r13,176(%rsp)
// mul
xorq %r13,%r13
movq 56(%rsp),%rdx
mulx 120(%rsp),%r8,%r9
mulx 128(%rsp),%rbx,%r10
adcx %rbx,%r9
mulx 136(%rsp),%rbx,%r11
adcx %rbx,%r10
mulx 144(%rsp),%rbx,%r12
adcx %rbx,%r11
adcx %r13,%r12
xorq %r14,%r14
movq 64(%rsp),%rdx
mulx 120(%rsp),%rbx,%rbp
adcx %rbx,%r9
adox %rbp,%r10
mulx 128(%rsp),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 136(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 144(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
adcx %r14,%r13
xorq %r15,%r15
movq 72(%rsp),%rdx
mulx 120(%rsp),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 128(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 136(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 144(%rsp),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
adcx %r15,%r14
xorq %rax,%rax
movq 80(%rsp),%rdx
mulx 120(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 128(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 136(%rsp),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
mulx 144(%rsp),%rbx,%rbp
adcx %rbx,%r14
adox %rbp,%r15
adcx %rax,%r15
xorq %rbp,%rbp
movq $38,%rdx
mulx %r12,%rax,%r12
adcx %rax,%r8
adox %r12,%r9
mulx %r13,%rbx,%r13
adcx %rbx,%r9
adox %r13,%r10
mulx %r14,%rbx,%r14
adcx %rbx,%r10
adox %r14,%r11
mulx %r15,%rbx,%r15
adcx %rbx,%r11
adox %rbp,%r15
adcx %rbp,%r15
shld $1,%r11,%r15
andq mask63(%rip),%r11
imul $19,%r15,%r15
addq %r15,%r8
adcq $0,%r9
adcq $0,%r10
adcq $0,%r11
// store
movq %r8,56(%rsp)
movq %r9,64(%rsp)
movq %r10,72(%rsp)
movq %r11,80(%rsp)
// mul
xorq %r13,%r13
movq 88(%rsp),%rdx
mulx 152(%rsp),%r8,%r9
mulx 160(%rsp),%rbx,%r10
adcx %rbx,%r9
mulx 168(%rsp),%rbx,%r11
adcx %rbx,%r10
mulx 176(%rsp),%rbx,%r12
adcx %rbx,%r11
adcx %r13,%r12
xorq %r14,%r14
movq 96(%rsp),%rdx
mulx 152(%rsp),%rbx,%rbp
adcx %rbx,%r9
adox %rbp,%r10
mulx 160(%rsp),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 168(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 176(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
adcx %r14,%r13
xorq %r15,%r15
movq 104(%rsp),%rdx
mulx 152(%rsp),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 160(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 168(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 176(%rsp),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
adcx %r15,%r14
xorq %rax,%rax
movq 112(%rsp),%rdx
mulx 152(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 160(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 168(%rsp),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
mulx 176(%rsp),%rbx,%rbp
adcx %rbx,%r14
adox %rbp,%r15
adcx %rax,%r15
xorq %rbp,%rbp
movq $38,%rdx
mulx %r12,%rax,%r12
adcx %rax,%r8
adox %r12,%r9
mulx %r13,%rbx,%r13
adcx %rbx,%r9
adox %r13,%r10
mulx %r14,%rbx,%r14
adcx %rbx,%r10
adox %r14,%r11
mulx %r15,%rbx,%r15
adcx %rbx,%r11
adox %rbp,%r15
adcx %rbp,%r15
shld $1,%r11,%r15
andq mask63(%rip),%r11
imul $19,%r15,%r15
addq %r15,%r8
adcq $0,%r9
adcq $0,%r10
adcq $0,%r11
// copy
movq %r8,%r12
movq %r9,%r13
movq %r10,%r14
movq %r11,%r15
// add
addq 56(%rsp),%r12
adcq 64(%rsp),%r13
adcq 72(%rsp),%r14
adcq 80(%rsp),%r15
movq $0,%rdx
movq $38,%rax
cmovae %rdx,%rax
addq %rax,%r12
adcq %rdx,%r13
adcq %rdx,%r14
adcq %rdx,%r15
cmovc %rax,%rdx
addq %rdx,%r12
// sub
subq 56(%rsp),%r8
sbbq 64(%rsp),%r9
sbbq 72(%rsp),%r10
sbbq 80(%rsp),%r11
movq $0,%rdx
mov $38,%rax
cmovae %rdx,%rax
subq %rax,%r8
sbbq %rdx,%r9
sbbq %rdx,%r10
sbbq %rdx,%r11
cmovc %rax,%rdx
subq %rdx,%r8
// store
movq %r8,64(%rsp)
movq %r9,72(%rsp)
movq %r10,80(%rsp)
movq %r11,88(%rsp)
// store
movq %r12,128(%rsp)
movq %r13,136(%rsp)
movq %r14,144(%rsp)
movq %r15,152(%rsp)
// mul
xorq %r13,%r13
movq 96(%rsi),%rdx
mulx 96(%rcx),%r8,%r9
mulx 104(%rcx),%rbx,%r10
adcx %rbx,%r9
mulx 112(%rcx),%rbx,%r11
adcx %rbx,%r10
mulx 120(%rcx),%rbx,%r12
adcx %rbx,%r11
adcx %r13,%r12
xorq %r14,%r14
movq 104(%rsi),%rdx
mulx 96(%rcx),%rbx,%rbp
adcx %rbx,%r9
adox %rbp,%r10
mulx 104(%rcx),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 112(%rcx),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 120(%rcx),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
adcx %r14,%r13
xorq %r15,%r15
movq 112(%rsi),%rdx
mulx 96(%rcx),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 104(%rcx),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 112(%rcx),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 120(%rcx),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
adcx %r15,%r14
xorq %rax,%rax
movq 120(%rsi),%rdx
mulx 96(%rcx),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 104(%rcx),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 112(%rcx),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
mulx 120(%rcx),%rbx,%rbp
adcx %rbx,%r14
adox %rbp,%r15
adcx %rax,%r15
xorq %rbp,%rbp
movq $38,%rdx
mulx %r12,%rax,%r12
adcx %rax,%r8
adox %r12,%r9
mulx %r13,%rbx,%r13
adcx %rbx,%r9
adox %r13,%r10
mulx %r14,%rbx,%r14
adcx %rbx,%r10
adox %r14,%r11
mulx %r15,%rbx,%r15
adcx %rbx,%r11
adox %rbp,%r15
adcx %rbp,%r15
shld $1,%r11,%r15
andq mask63(%rip),%r11
imul $19,%r15,%r15
addq %r15,%r8
adcq $0,%r9
adcq $0,%r10
adcq $0,%r11
// store
movq %r8,184(%rsp)
movq %r9,192(%rsp)
movq %r10,200(%rsp)
movq %r11,208(%rsp)
// mul
xorq %r13,%r13
movq EC2D0(%rip),%rdx
mulx 184(%rsp),%r8,%r9
mulx 192(%rsp),%rbx,%r10
adcx %rbx,%r9
mulx 200(%rsp),%rbx,%r11
adcx %rbx,%r10
mulx 208(%rsp),%rbx,%r12
adcx %rbx,%r11
adcx %r13,%r12
xorq %r14,%r14
movq EC2D1(%rip),%rdx
mulx 184(%rsp),%rbx,%rbp
adcx %rbx,%r9
adox %rbp,%r10
mulx 192(%rsp),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 200(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 208(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
adcx %r14,%r13
xorq %r15,%r15
movq EC2D2(%rip),%rdx
mulx 184(%rsp),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 192(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 200(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 208(%rsp),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
adcx %r15,%r14
xorq %rax,%rax
movq EC2D3(%rip),%rdx
mulx 184(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 192(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 200(%rsp),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
mulx 208(%rsp),%rbx,%rbp
adcx %rbx,%r14
adox %rbp,%r15
adcx %rax,%r15
xorq %rbp,%rbp
movq $38,%rdx
mulx %r12,%rax,%r12
adcx %rax,%r8
adox %r12,%r9
mulx %r13,%rbx,%r13
adcx %rbx,%r9
adox %r13,%r10
mulx %r14,%rbx,%r14
adcx %rbx,%r10
adox %r14,%r11
mulx %r15,%rbx,%r15
adcx %rbx,%r11
adox %rbp,%r15
adcx %rbp,%r15
shld $1,%r11,%r15
andq mask63(%rip),%r11
imul $19,%r15,%r15
addq %r15,%r8
adcq $0,%r9
adcq $0,%r10
adcq $0,%r11
// store
movq %r8,184(%rsp)
movq %r9,192(%rsp)
movq %r10,200(%rsp)
movq %r11,208(%rsp)
// mul
xorq %r13,%r13
movq 64(%rsi),%rdx
mulx 64(%rcx),%r8,%r9
mulx 72(%rcx),%rbx,%r10
adcx %rbx,%r9
mulx 80(%rcx),%rbx,%r11
adcx %rbx,%r10
mulx 88(%rcx),%rbx,%r12
adcx %rbx,%r11
adcx %r13,%r12
xorq %r14,%r14
movq 72(%rsi),%rdx
mulx 64(%rcx),%rbx,%rbp
adcx %rbx,%r9
adox %rbp,%r10
mulx 72(%rcx),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 80(%rcx),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 88(%rcx),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
adcx %r14,%r13
xorq %r15,%r15
movq 80(%rsi),%rdx
mulx 64(%rcx),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 72(%rcx),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 80(%rcx),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 88(%rcx),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
adcx %r15,%r14
xorq %rax,%rax
movq 88(%rsi),%rdx
mulx 64(%rcx),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 72(%rcx),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 80(%rcx),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
mulx 88(%rcx),%rbx,%rbp
adcx %rbx,%r14
adox %rbp,%r15
adcx %rax,%r15
xorq %rbp,%rbp
movq $38,%rdx
mulx %r12,%rax,%r12
adcx %rax,%r8
adox %r12,%r9
mulx %r13,%rbx,%r13
adcx %rbx,%r9
adox %r13,%r10
mulx %r14,%rbx,%r14
adcx %rbx,%r10
adox %r14,%r11
mulx %r15,%rbx,%r15
adcx %rbx,%r11
adox %rbp,%r15
adcx %rbp,%r15
shld $1,%r11,%r15
andq mask63(%rip),%r11
imul $19,%r15,%r15
addq %r15,%r8
adcq $0,%r9
adcq $0,%r10
adcq $0,%r11
// double
addq %r8,%r8
adcq %r9,%r9
adcq %r10,%r10
adcq %r11,%r11
movq $0,%rdx
movq $38,%rcx
cmovae %rdx,%rcx
addq %rcx,%r8
adcq %rdx,%r9
adcq %rdx,%r10
adcq %rdx,%r11
cmovc %rcx,%rdx
addq %rdx,%r8
// copy
movq %r8,%r12
movq %r9,%r13
movq %r10,%r14
movq %r11,%r15
// add
addq 184(%rsp),%r12
adcq 192(%rsp),%r13
adcq 200(%rsp),%r14
adcq 208(%rsp),%r15
movq $0,%rdx
movq $38,%rax
cmovae %rdx,%rax
addq %rax,%r12
adcq %rdx,%r13
adcq %rdx,%r14
adcq %rdx,%r15
cmovc %rax,%rdx
addq %rdx,%r12
// sub
subq 184(%rsp),%r8
sbbq 192(%rsp),%r9
sbbq 200(%rsp),%r10
sbbq 208(%rsp),%r11
movq $0,%rdx
mov $38,%rax
cmovae %rdx,%rax
subq %rax,%r8
sbbq %rdx,%r9
sbbq %rdx,%r10
sbbq %rdx,%r11
cmovc %rax,%rdx
subq %rdx,%r8
// store
movq %r12,96(%rsp)
movq %r13,104(%rsp)
movq %r14,112(%rsp)
movq %r15,120(%rsp)
// store
movq %r8,160(%rsp)
movq %r9,168(%rsp)
movq %r10,176(%rsp)
movq %r11,184(%rsp)
/* p1p1 to p3 */
// mul
xorq %r13,%r13
movq 64(%rsp),%rdx
mulx 160(%rsp),%r8,%r9
mulx 168(%rsp),%rbx,%r10
adcx %rbx,%r9
mulx 176(%rsp),%rbx,%r11
adcx %rbx,%r10
mulx 184(%rsp),%rbx,%r12
adcx %rbx,%r11
adcx %r13,%r12
xorq %r14,%r14
movq 72(%rsp),%rdx
mulx 160(%rsp),%rbx,%rbp
adcx %rbx,%r9
adox %rbp,%r10
mulx 168(%rsp),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 176(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 184(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
adcx %r14,%r13
xorq %r15,%r15
movq 80(%rsp),%rdx
mulx 160(%rsp),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 168(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 176(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 184(%rsp),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
adcx %r15,%r14
xorq %rax,%rax
movq 88(%rsp),%rdx
mulx 160(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 168(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 176(%rsp),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
mulx 184(%rsp),%rbx,%rbp
adcx %rbx,%r14
adox %rbp,%r15
adcx %rax,%r15
xorq %rbp,%rbp
movq $38,%rdx
mulx %r12,%rax,%r12
adcx %rax,%r8
adox %r12,%r9
mulx %r13,%rbx,%r13
adcx %rbx,%r9
adox %r13,%r10
mulx %r14,%rbx,%r14
adcx %rbx,%r10
adox %r14,%r11
mulx %r15,%rbx,%r15
adcx %rbx,%r11
adox %rbp,%r15
adcx %rbp,%r15
shld $1,%r11,%r15
andq mask63(%rip),%r11
imul $19,%r15,%r15
addq %r15,%r8
adcq $0,%r9
adcq $0,%r10
adcq $0,%r11
movq %r8,0(%rdi)
movq %r9,8(%rdi)
movq %r10,16(%rdi)
movq %r11,24(%rdi)
// mul
xorq %r13,%r13
movq 96(%rsp),%rdx
mulx 128(%rsp),%r8,%r9
mulx 136(%rsp),%rbx,%r10
adcx %rbx,%r9
mulx 144(%rsp),%rbx,%r11
adcx %rbx,%r10
mulx 152(%rsp),%rbx,%r12
adcx %rbx,%r11
adcx %r13,%r12
xorq %r14,%r14
movq 104(%rsp),%rdx
mulx 128(%rsp),%rbx,%rbp
adcx %rbx,%r9
adox %rbp,%r10
mulx 136(%rsp),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 144(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 152(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
adcx %r14,%r13
xorq %r15,%r15
movq 112(%rsp),%rdx
mulx 128(%rsp),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 136(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 144(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 152(%rsp),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
adcx %r15,%r14
xorq %rax,%rax
movq 120(%rsp),%rdx
mulx 128(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 136(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 144(%rsp),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
mulx 152(%rsp),%rbx,%rbp
adcx %rbx,%r14
adox %rbp,%r15
adcx %rax,%r15
xorq %rbp,%rbp
movq $38,%rdx
mulx %r12,%rax,%r12
adcx %rax,%r8
adox %r12,%r9
mulx %r13,%rbx,%r13
adcx %rbx,%r9
adox %r13,%r10
mulx %r14,%rbx,%r14
adcx %rbx,%r10
adox %r14,%r11
mulx %r15,%rbx,%r15
adcx %rbx,%r11
adox %rbp,%r15
adcx %rbp,%r15
shld $1,%r11,%r15
andq mask63(%rip),%r11
imul $19,%r15,%r15
addq %r15,%r8
adcq $0,%r9
adcq $0,%r10
adcq $0,%r11
movq %r8,32(%rdi)
movq %r9,40(%rdi)
movq %r10,48(%rdi)
movq %r11,56(%rdi)
// mul
xorq %r13,%r13
movq 96(%rsp),%rdx
mulx 160(%rsp),%r8,%r9
mulx 168(%rsp),%rbx,%r10
adcx %rbx,%r9
mulx 176(%rsp),%rbx,%r11
adcx %rbx,%r10
mulx 184(%rsp),%rbx,%r12
adcx %rbx,%r11
adcx %r13,%r12
xorq %r14,%r14
movq 104(%rsp),%rdx
mulx 160(%rsp),%rbx,%rbp
adcx %rbx,%r9
adox %rbp,%r10
mulx 168(%rsp),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 176(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 184(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
adcx %r14,%r13
xorq %r15,%r15
movq 112(%rsp),%rdx
mulx 160(%rsp),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 168(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 176(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 184(%rsp),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
adcx %r15,%r14
xorq %rax,%rax
movq 120(%rsp),%rdx
mulx 160(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 168(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 176(%rsp),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
mulx 184(%rsp),%rbx,%rbp
adcx %rbx,%r14
adox %rbp,%r15
adcx %rax,%r15
xorq %rbp,%rbp
movq $38,%rdx
mulx %r12,%rax,%r12
adcx %rax,%r8
adox %r12,%r9
mulx %r13,%rbx,%r13
adcx %rbx,%r9
adox %r13,%r10
mulx %r14,%rbx,%r14
adcx %rbx,%r10
adox %r14,%r11
mulx %r15,%rbx,%r15
adcx %rbx,%r11
adox %rbp,%r15
adcx %rbp,%r15
shld $1,%r11,%r15
andq mask63(%rip),%r11
imul $19,%r15,%r15
addq %r15,%r8
adcq $0,%r9
adcq $0,%r10
adcq $0,%r11
movq %r8,64(%rdi)
movq %r9,72(%rdi)
movq %r10,80(%rdi)
movq %r11,88(%rdi)
// mul
xorq %r13,%r13
movq 64(%rsp),%rdx
mulx 128(%rsp),%r8,%r9
mulx 136(%rsp),%rbx,%r10
adcx %rbx,%r9
mulx 144(%rsp),%rbx,%r11
adcx %rbx,%r10
mulx 152(%rsp),%rbx,%r12
adcx %rbx,%r11
adcx %r13,%r12
xorq %r14,%r14
movq 72(%rsp),%rdx
mulx 128(%rsp),%rbx,%rbp
adcx %rbx,%r9
adox %rbp,%r10
mulx 136(%rsp),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 144(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 152(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
adcx %r14,%r13
xorq %r15,%r15
movq 80(%rsp),%rdx
mulx 128(%rsp),%rbx,%rbp
adcx %rbx,%r10
adox %rbp,%r11
mulx 136(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 144(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 152(%rsp),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
adcx %r15,%r14
xorq %rax,%rax
movq 88(%rsp),%rdx
mulx 128(%rsp),%rbx,%rbp
adcx %rbx,%r11
adox %rbp,%r12
mulx 136(%rsp),%rbx,%rbp
adcx %rbx,%r12
adox %rbp,%r13
mulx 144(%rsp),%rbx,%rbp
adcx %rbx,%r13
adox %rbp,%r14
mulx 152(%rsp),%rbx,%rbp
adcx %rbx,%r14
adox %rbp,%r15
adcx %rax,%r15
xorq %rbp,%rbp
movq $38,%rdx
mulx %r12,%rax,%r12
adcx %rax,%r8
adox %r12,%r9
mulx %r13,%rbx,%r13
adcx %rbx,%r9
adox %r13,%r10
mulx %r14,%rbx,%r14
adcx %rbx,%r10
adox %r14,%r11
mulx %r15,%rbx,%r15
adcx %rbx,%r11
adox %rbp,%r15
adcx %rbp,%r15
shld $1,%r11,%r15
andq mask63(%rip),%r11
imul $19,%r15,%r15
addq %r15,%r8
adcq $0,%r9
adcq $0,%r10
adcq $0,%r11
movq %r8,96(%rdi)
movq %r9,104(%rdi)
movq %r10,112(%rdi)
movq %r11,120(%rdi)
movq 0(%rsp),%r11
movq 8(%rsp),%r12
movq 16(%rsp),%r13
movq 24(%rsp),%r14
movq 32(%rsp),%r15
movq 40(%rsp),%rbx
movq 48(%rsp),%rbp
movq %r11,%rsp
ret