mirror of
https://github.com/amd/blis.git
synced 2026-05-13 02:25:39 +00:00
BLIS: Missing clobbers (batch 2)
Add missing clobbers in other zen4 kernels. AMD-Internal: [CPUPL-3456] Change-Id: I5cceb44fe100e03269cfe21d8c4c0d2171b921c3
This commit is contained in:
@@ -731,7 +731,7 @@ void bli_dpackm_zen4_asm_24xk
|
||||
"zmm4", "zmm5", "zmm6", "zmm7",
|
||||
"zmm8", "zmm9", "zmm10", "zmm11",
|
||||
"zmm12", "zmm13", "zmm14", "zmm15",
|
||||
"memory"
|
||||
"zmm16", "zmm18", "zmm20", "zmm30", "zmm31", "memory"
|
||||
)
|
||||
}
|
||||
else // if ( cdim0 < mnr || gs || !unitk )
|
||||
|
||||
@@ -383,7 +383,7 @@ void bli_dpackm_zen4_asm_8xk
|
||||
"zmm4", "zmm5", "zmm6", "zmm7",
|
||||
"zmm8", "zmm9", "zmm10", "zmm11",
|
||||
"zmm12", "zmm13", "zmm14", "zmm15",
|
||||
"memory"
|
||||
"zmm16", "zmm18", "zmm20", "zmm30", "zmm31", "memory"
|
||||
)
|
||||
}
|
||||
else // if ( cdim0 < mnr || gs || !unitk )
|
||||
|
||||
@@ -1659,10 +1659,14 @@ void bli_dgemmtrsm_l_zen_asm_16x14
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rdi", "rsi", "r8", "r9", "r10", "r11", "r12",
|
||||
"r13", "r14", "r15", "zmm0", "zmm1", "zmm2", "zmm3", "zmm4", "zmm5",
|
||||
"xmm0", "xmm1",
|
||||
"ymm0", "ymm1", "ymm4", "ymm6", "ymm20", "ymm21", "ymm22", "ymm23",
|
||||
"ymm24", "ymm25", "ymm26", "ymm27", "ymm28", "ymm29", "ymm30", "ymm31",
|
||||
"zmm6", "zmm7", "zmm8", "zmm9", "zmm10", "zmm11", "zmm12", "zmm13",
|
||||
"zmm14", "zmm15", "zmm16", "zmm17", "zmm18", "zmm19", "zmm20", "zmm21",
|
||||
"zmm22", "zmm23", "zmm24", "zmm25", "zmm26", "zmm27", "zmm28", "zmm29",
|
||||
"zmm30", "zmm31", "memory"
|
||||
"zmm30", "zmm31",
|
||||
"memory"
|
||||
)
|
||||
|
||||
AOCL_DTL_TRACE_EXIT(AOCL_DTL_LEVEL_TRACE_9);
|
||||
|
||||
@@ -1696,10 +1696,14 @@ void bli_dgemmtrsm_u_zen_asm_16x14
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rdi", "rsi", "r8", "r9", "r10", "r11", "r12",
|
||||
"r13", "r14", "r15", "zmm0", "zmm1", "zmm2", "zmm3", "zmm4", "zmm5",
|
||||
"xmm0", "xmm1",
|
||||
"ymm0", "ymm1", "ymm4", "ymm6", "ymm20", "ymm21", "ymm22", "ymm23",
|
||||
"ymm24", "ymm25", "ymm26", "ymm27", "ymm28", "ymm29", "ymm30", "ymm31",
|
||||
"zmm6", "zmm7", "zmm8", "zmm9", "zmm10", "zmm11", "zmm12", "zmm13",
|
||||
"zmm14", "zmm15", "zmm16", "zmm17", "zmm18", "zmm19", "zmm20", "zmm21",
|
||||
"zmm22", "zmm23", "zmm24", "zmm25", "zmm26", "zmm27", "zmm28", "zmm29",
|
||||
"zmm30", "zmm31", "memory"
|
||||
"zmm30", "zmm31",
|
||||
"memory"
|
||||
)
|
||||
|
||||
AOCL_DTL_TRACE_EXIT(AOCL_DTL_LEVEL_TRACE_9);
|
||||
|
||||
@@ -1786,6 +1786,8 @@ void bli_dgemmsup_rv_zen4_asm_24x8m
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -3281,6 +3283,8 @@ void bli_dgemmsup_rv_zen4_asm_24x7m
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -4664,6 +4668,8 @@ void bli_dgemmsup_rv_zen4_asm_24x6m
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -5930,6 +5936,8 @@ void bli_dgemmsup_rv_zen4_asm_24x5m
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -7030,6 +7038,8 @@ void bli_dgemmsup_rv_zen4_asm_24x4m
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -8011,6 +8021,8 @@ void bli_dgemmsup_rv_zen4_asm_24x3m
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -8877,6 +8889,8 @@ void bli_dgemmsup_rv_zen4_asm_24x2m
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -9627,6 +9641,8 @@ void bli_dgemmsup_rv_zen4_asm_24x1m
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
|
||||
@@ -452,6 +452,12 @@ void bli_sgemmsup_rd_zen_asm_5x64_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
|
||||
"ymm20", "ymm21", "ymm23", "ymm24", "ymm26", "ymm27",
|
||||
"ymm29", "ymm30",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -852,6 +858,11 @@ void bli_sgemmsup_rd_zen_asm_4x64_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
|
||||
"ymm20", "ymm23", "ymm26", "ymm29",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -1234,6 +1245,10 @@ void bli_sgemmsup_rd_zen_asm_3x64_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -1599,6 +1614,10 @@ void bli_sgemmsup_rd_zen_asm_2x64_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm17", "ymm18",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -1950,6 +1969,10 @@ void bli_sgemmsup_rd_zen_asm_1x64_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm4", "xmm6",
|
||||
"ymm0", "ymm2", "ymm3", "ymm4", "ymm6",
|
||||
"ymm7", "ymm8", "ymm10", "ymm11", "ymm13",
|
||||
"ymm14", "ymm17",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -2368,6 +2391,12 @@ void bli_sgemmsup_rd_zen_asm_5x48_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
|
||||
"ymm20", "ymm21", "ymm23", "ymm24", "ymm26", "ymm27",
|
||||
"ymm29", "ymm30",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -2775,6 +2804,11 @@ void bli_sgemmsup_rd_zen_asm_4x48_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
|
||||
"ymm20", "ymm23", "ymm26", "ymm29",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -3156,6 +3190,10 @@ void bli_sgemmsup_rd_zen_asm_3x48_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -3522,6 +3560,10 @@ void bli_sgemmsup_rd_zen_asm_2x48_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm17", "ymm18",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -3873,6 +3915,9 @@ void bli_sgemmsup_rd_zen_asm_1x48_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm4", "xmm6",
|
||||
"ymm0", "ymm2", "ymm3", "ymm4", "ymm6",
|
||||
"ymm7", "ymm8", "ymm10", "ymm11", "ymm13", "ymm14", "ymm17",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -4290,6 +4335,12 @@ void bli_sgemmsup_rd_zen_asm_5x32_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
|
||||
"ymm20", "ymm21", "ymm23", "ymm24", "ymm26", "ymm27",
|
||||
"ymm29", "ymm30",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -4696,6 +4747,11 @@ void bli_sgemmsup_rd_zen_asm_4x32_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
|
||||
"ymm20", "ymm23", "ymm26", "ymm29",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -5078,6 +5134,10 @@ void bli_sgemmsup_rd_zen_asm_3x32_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -5443,6 +5503,10 @@ void bli_sgemmsup_rd_zen_asm_2x32_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm17", "ymm18",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -5794,6 +5858,10 @@ void bli_sgemmsup_rd_zen_asm_1x32_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm4", "xmm6",
|
||||
"ymm0", "ymm2", "ymm3", "ymm4", "ymm6",
|
||||
"ymm7", "ymm8", "ymm10", "ymm11", "ymm13",
|
||||
"ymm14", "ymm17",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
|
||||
@@ -590,6 +590,12 @@ void bli_sgemmsup_rd_zen_asm_6x64m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
|
||||
"ymm20", "ymm21", "ymm22", "ymm23", "ymm24", "ymm25",
|
||||
"ymm26", "ymm27", "ymm28", "ymm29", "ymm30", "ymm31",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -1111,6 +1117,12 @@ void bli_sgemmsup_rd_zen_asm_6x48m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
|
||||
"ymm20", "ymm21", "ymm22", "ymm23", "ymm24", "ymm25",
|
||||
"ymm26", "ymm27", "ymm28", "ymm29", "ymm30", "ymm31",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -1632,6 +1644,12 @@ void bli_sgemmsup_rd_zen_asm_6x32m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
|
||||
"ymm20", "ymm21", "ymm22", "ymm23", "ymm24", "ymm25",
|
||||
"ymm26", "ymm27", "ymm28", "ymm29", "ymm30", "ymm31",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
|
||||
@@ -530,6 +530,12 @@ void bli_sgemmsup_rd_zen_asm_6x64n_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
|
||||
"ymm20", "ymm21", "ymm22", "ymm23", "ymm24", "ymm25",
|
||||
"ymm26", "ymm27", "ymm28", "ymm29", "ymm30", "ymm31",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -940,6 +946,10 @@ void bli_sgemmsup_rd_zen_asm_3x64n_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -1343,6 +1353,10 @@ void bli_sgemmsup_rd_zen_asm_2x64n_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm4", "xmm5", "xmm6",
|
||||
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
|
||||
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
|
||||
"ymm14", "ymm15", "ymm17", "ymm18",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
|
||||
@@ -354,6 +354,7 @@ void bli_sgemmsup_rv_zen_asm_5x48_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -668,6 +669,7 @@ void bli_sgemmsup_rv_zen_asm_5x32_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -973,6 +975,7 @@ void bli_sgemmsup_rv_zen_asm_5x16_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -1273,6 +1276,7 @@ void bli_sgemmsup_rv_zen_asm_3x48_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -1562,6 +1566,7 @@ void bli_sgemmsup_rv_zen_asm_3x32_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -1840,6 +1845,7 @@ void bli_sgemmsup_rv_zen_asm_3x16_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
|
||||
@@ -621,6 +621,7 @@ void bli_sgemmsup_rv_zen_asm_6x64m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -1071,6 +1072,7 @@ void bli_sgemmsup_rv_zen_asm_6x48m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -1505,6 +1507,7 @@ void bli_sgemmsup_rv_zen_asm_6x32m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -1928,6 +1931,7 @@ void bli_sgemmsup_rv_zen_asm_6x16m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -2302,6 +2306,7 @@ void bli_sgemmsup_rv_zen_asm_4x64m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm1", "xmm4",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -2604,6 +2609,7 @@ void bli_sgemmsup_rv_zen_asm_4x48m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm1", "xmm4",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -2897,6 +2903,7 @@ void bli_sgemmsup_rv_zen_asm_4x32m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm1", "xmm4",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -3182,6 +3189,7 @@ void bli_sgemmsup_rv_zen_asm_4x16m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm1", "xmm4",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -3466,6 +3474,7 @@ void bli_sgemmsup_rv_zen_asm_2x64m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -3741,6 +3750,7 @@ void bli_sgemmsup_rv_zen_asm_2x48m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -4007,6 +4017,7 @@ void bli_sgemmsup_rv_zen_asm_2x32m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -4263,6 +4274,7 @@ void bli_sgemmsup_rv_zen_asm_2x16m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -4513,6 +4525,7 @@ void bli_sgemmsup_rv_zen_asm_1x64m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -4756,6 +4769,7 @@ void bli_sgemmsup_rv_zen_asm_1x48m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -4991,6 +5005,7 @@ void bli_sgemmsup_rv_zen_asm_1x32m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -5221,6 +5236,7 @@ void bli_sgemmsup_rv_zen_asm_1x16m_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
|
||||
@@ -487,6 +487,7 @@ void bli_sgemmsup_rv_zen_asm_6x64n_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -1022,6 +1023,7 @@ void bli_sgemmsup_rv_zen_asm_5x64n_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -1515,6 +1517,7 @@ void bli_sgemmsup_rv_zen_asm_4x64n_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm1", "xmm4",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -2009,6 +2012,7 @@ void bli_sgemmsup_rv_zen_asm_3x64n_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -2462,6 +2466,7 @@ void bli_sgemmsup_rv_zen_asm_2x64n_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -2896,6 +2901,7 @@ void bli_sgemmsup_rv_zen_asm_1x64n_avx512
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
|
||||
@@ -1075,6 +1075,8 @@ void bli_dgemmsup_rv_zen4_asm_24x1
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -1689,6 +1691,8 @@ void bli_dgemmsup_rv_zen4_asm_16x1
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -2221,6 +2225,8 @@ void bli_dgemmsup_rv_zen4_asm_8x1
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
|
||||
@@ -1197,6 +1197,8 @@ void bli_dgemmsup_rv_zen4_asm_24x2
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -1901,6 +1903,8 @@ void bli_dgemmsup_rv_zen4_asm_16x2
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -2492,6 +2496,8 @@ void bli_dgemmsup_rv_zen4_asm_8x2
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
|
||||
@@ -1313,6 +1313,8 @@ void bli_dgemmsup_rv_zen4_asm_24x3
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -2103,6 +2105,8 @@ void bli_dgemmsup_rv_zen4_asm_16x3
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -2752,6 +2756,8 @@ void bli_dgemmsup_rv_zen4_asm_8x3
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
|
||||
@@ -1429,6 +1429,8 @@ void bli_dgemmsup_rv_zen4_asm_24x4
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -2311,6 +2313,8 @@ void bli_dgemmsup_rv_zen4_asm_16x4
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -3020,6 +3024,8 @@ void bli_dgemmsup_rv_zen4_asm_8x4
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
|
||||
@@ -1599,6 +1599,8 @@ void bli_dgemmsup_rv_zen4_asm_24x5
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -2614,6 +2616,8 @@ void bli_dgemmsup_rv_zen4_asm_16x5
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -3421,6 +3425,8 @@ void bli_dgemmsup_rv_zen4_asm_8x5
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
|
||||
@@ -1718,6 +1718,8 @@ void bli_dgemmsup_rv_zen4_asm_24x6
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -2823,6 +2825,8 @@ void bli_dgemmsup_rv_zen4_asm_16x6
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -3689,6 +3693,8 @@ void bli_dgemmsup_rv_zen4_asm_8x6
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
|
||||
@@ -1835,6 +1835,8 @@ void bli_dgemmsup_rv_zen4_asm_24x7
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -3027,6 +3029,8 @@ void bli_dgemmsup_rv_zen4_asm_16x7
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -3950,6 +3954,8 @@ void bli_dgemmsup_rv_zen4_asm_8x7
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
|
||||
@@ -1915,6 +1915,8 @@ void bli_dgemmsup_rv_zen4_asm_24x8
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -3190,6 +3192,8 @@ void bli_dgemmsup_rv_zen4_asm_16x8
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
@@ -4164,6 +4168,8 @@ void bli_dgemmsup_rv_zen4_asm_8x8
|
||||
: // register clobber list
|
||||
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
|
||||
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
|
||||
"xmm2", "xmm31",
|
||||
"ymm2",
|
||||
"zmm0", "zmm1", "zmm2", "zmm3",
|
||||
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
|
||||
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
|
||||
|
||||
Reference in New Issue
Block a user