BLIS: Missing clobbers (batch 2)

Add missing clobbers in other zen4 kernels.

AMD-Internal: [CPUPL-3456]
Change-Id: I5cceb44fe100e03269cfe21d8c4c0d2171b921c3
This commit is contained in:
Edward Smyth
2023-05-22 11:41:37 -04:00
parent ea2eea5097
commit e960141fe2
19 changed files with 204 additions and 4 deletions

View File

@@ -731,7 +731,7 @@ void bli_dpackm_zen4_asm_24xk
"zmm4", "zmm5", "zmm6", "zmm7",
"zmm8", "zmm9", "zmm10", "zmm11",
"zmm12", "zmm13", "zmm14", "zmm15",
"memory"
"zmm16", "zmm18", "zmm20", "zmm30", "zmm31", "memory"
)
}
else // if ( cdim0 < mnr || gs || !unitk )

View File

@@ -383,7 +383,7 @@ void bli_dpackm_zen4_asm_8xk
"zmm4", "zmm5", "zmm6", "zmm7",
"zmm8", "zmm9", "zmm10", "zmm11",
"zmm12", "zmm13", "zmm14", "zmm15",
"memory"
"zmm16", "zmm18", "zmm20", "zmm30", "zmm31", "memory"
)
}
else // if ( cdim0 < mnr || gs || !unitk )

View File

@@ -1659,10 +1659,14 @@ void bli_dgemmtrsm_l_zen_asm_16x14
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rdi", "rsi", "r8", "r9", "r10", "r11", "r12",
"r13", "r14", "r15", "zmm0", "zmm1", "zmm2", "zmm3", "zmm4", "zmm5",
"xmm0", "xmm1",
"ymm0", "ymm1", "ymm4", "ymm6", "ymm20", "ymm21", "ymm22", "ymm23",
"ymm24", "ymm25", "ymm26", "ymm27", "ymm28", "ymm29", "ymm30", "ymm31",
"zmm6", "zmm7", "zmm8", "zmm9", "zmm10", "zmm11", "zmm12", "zmm13",
"zmm14", "zmm15", "zmm16", "zmm17", "zmm18", "zmm19", "zmm20", "zmm21",
"zmm22", "zmm23", "zmm24", "zmm25", "zmm26", "zmm27", "zmm28", "zmm29",
"zmm30", "zmm31", "memory"
"zmm30", "zmm31",
"memory"
)
AOCL_DTL_TRACE_EXIT(AOCL_DTL_LEVEL_TRACE_9);

View File

@@ -1696,10 +1696,14 @@ void bli_dgemmtrsm_u_zen_asm_16x14
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rdi", "rsi", "r8", "r9", "r10", "r11", "r12",
"r13", "r14", "r15", "zmm0", "zmm1", "zmm2", "zmm3", "zmm4", "zmm5",
"xmm0", "xmm1",
"ymm0", "ymm1", "ymm4", "ymm6", "ymm20", "ymm21", "ymm22", "ymm23",
"ymm24", "ymm25", "ymm26", "ymm27", "ymm28", "ymm29", "ymm30", "ymm31",
"zmm6", "zmm7", "zmm8", "zmm9", "zmm10", "zmm11", "zmm12", "zmm13",
"zmm14", "zmm15", "zmm16", "zmm17", "zmm18", "zmm19", "zmm20", "zmm21",
"zmm22", "zmm23", "zmm24", "zmm25", "zmm26", "zmm27", "zmm28", "zmm29",
"zmm30", "zmm31", "memory"
"zmm30", "zmm31",
"memory"
)
AOCL_DTL_TRACE_EXIT(AOCL_DTL_LEVEL_TRACE_9);

View File

@@ -1786,6 +1786,8 @@ void bli_dgemmsup_rv_zen4_asm_24x8m
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -3281,6 +3283,8 @@ void bli_dgemmsup_rv_zen4_asm_24x7m
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -4664,6 +4668,8 @@ void bli_dgemmsup_rv_zen4_asm_24x6m
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -5930,6 +5936,8 @@ void bli_dgemmsup_rv_zen4_asm_24x5m
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -7030,6 +7038,8 @@ void bli_dgemmsup_rv_zen4_asm_24x4m
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -8011,6 +8021,8 @@ void bli_dgemmsup_rv_zen4_asm_24x3m
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -8877,6 +8889,8 @@ void bli_dgemmsup_rv_zen4_asm_24x2m
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -9627,6 +9641,8 @@ void bli_dgemmsup_rv_zen4_asm_24x1m
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",

View File

@@ -452,6 +452,12 @@ void bli_sgemmsup_rd_zen_asm_5x64_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
"ymm20", "ymm21", "ymm23", "ymm24", "ymm26", "ymm27",
"ymm29", "ymm30",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -852,6 +858,11 @@ void bli_sgemmsup_rd_zen_asm_4x64_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
"ymm20", "ymm23", "ymm26", "ymm29",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -1234,6 +1245,10 @@ void bli_sgemmsup_rd_zen_asm_3x64_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -1599,6 +1614,10 @@ void bli_sgemmsup_rd_zen_asm_2x64_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm17", "ymm18",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -1950,6 +1969,10 @@ void bli_sgemmsup_rd_zen_asm_1x64_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm4", "xmm6",
"ymm0", "ymm2", "ymm3", "ymm4", "ymm6",
"ymm7", "ymm8", "ymm10", "ymm11", "ymm13",
"ymm14", "ymm17",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -2368,6 +2391,12 @@ void bli_sgemmsup_rd_zen_asm_5x48_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
"ymm20", "ymm21", "ymm23", "ymm24", "ymm26", "ymm27",
"ymm29", "ymm30",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -2775,6 +2804,11 @@ void bli_sgemmsup_rd_zen_asm_4x48_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
"ymm20", "ymm23", "ymm26", "ymm29",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -3156,6 +3190,10 @@ void bli_sgemmsup_rd_zen_asm_3x48_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -3522,6 +3560,10 @@ void bli_sgemmsup_rd_zen_asm_2x48_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm17", "ymm18",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -3873,6 +3915,9 @@ void bli_sgemmsup_rd_zen_asm_1x48_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm4", "xmm6",
"ymm0", "ymm2", "ymm3", "ymm4", "ymm6",
"ymm7", "ymm8", "ymm10", "ymm11", "ymm13", "ymm14", "ymm17",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -4290,6 +4335,12 @@ void bli_sgemmsup_rd_zen_asm_5x32_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
"ymm20", "ymm21", "ymm23", "ymm24", "ymm26", "ymm27",
"ymm29", "ymm30",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -4696,6 +4747,11 @@ void bli_sgemmsup_rd_zen_asm_4x32_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
"ymm20", "ymm23", "ymm26", "ymm29",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -5078,6 +5134,10 @@ void bli_sgemmsup_rd_zen_asm_3x32_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -5443,6 +5503,10 @@ void bli_sgemmsup_rd_zen_asm_2x32_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm17", "ymm18",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -5794,6 +5858,10 @@ void bli_sgemmsup_rd_zen_asm_1x32_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm4", "xmm6",
"ymm0", "ymm2", "ymm3", "ymm4", "ymm6",
"ymm7", "ymm8", "ymm10", "ymm11", "ymm13",
"ymm14", "ymm17",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",

View File

@@ -590,6 +590,12 @@ void bli_sgemmsup_rd_zen_asm_6x64m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
"ymm20", "ymm21", "ymm22", "ymm23", "ymm24", "ymm25",
"ymm26", "ymm27", "ymm28", "ymm29", "ymm30", "ymm31",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -1111,6 +1117,12 @@ void bli_sgemmsup_rd_zen_asm_6x48m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
"ymm20", "ymm21", "ymm22", "ymm23", "ymm24", "ymm25",
"ymm26", "ymm27", "ymm28", "ymm29", "ymm30", "ymm31",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -1632,6 +1644,12 @@ void bli_sgemmsup_rd_zen_asm_6x32m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
"ymm20", "ymm21", "ymm22", "ymm23", "ymm24", "ymm25",
"ymm26", "ymm27", "ymm28", "ymm29", "ymm30", "ymm31",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",

View File

@@ -530,6 +530,12 @@ void bli_sgemmsup_rd_zen_asm_6x64n_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
"ymm20", "ymm21", "ymm22", "ymm23", "ymm24", "ymm25",
"ymm26", "ymm27", "ymm28", "ymm29", "ymm30", "ymm31",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -940,6 +946,10 @@ void bli_sgemmsup_rd_zen_asm_3x64n_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm16", "ymm17", "ymm18", "ymm19",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -1343,6 +1353,10 @@ void bli_sgemmsup_rd_zen_asm_2x64n_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm4", "xmm5", "xmm6",
"ymm0", "ymm1", "ymm2", "ymm3", "ymm4", "ymm5", "ymm6",
"ymm7", "ymm8", "ymm9", "ymm10", "ymm11", "ymm12", "ymm13",
"ymm14", "ymm15", "ymm17", "ymm18",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",

View File

@@ -354,6 +354,7 @@ void bli_sgemmsup_rv_zen_asm_5x48_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -668,6 +669,7 @@ void bli_sgemmsup_rv_zen_asm_5x32_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -973,6 +975,7 @@ void bli_sgemmsup_rv_zen_asm_5x16_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -1273,6 +1276,7 @@ void bli_sgemmsup_rv_zen_asm_3x48_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -1562,6 +1566,7 @@ void bli_sgemmsup_rv_zen_asm_3x32_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -1840,6 +1845,7 @@ void bli_sgemmsup_rv_zen_asm_3x16_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",

View File

@@ -621,6 +621,7 @@ void bli_sgemmsup_rv_zen_asm_6x64m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -1071,6 +1072,7 @@ void bli_sgemmsup_rv_zen_asm_6x48m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -1505,6 +1507,7 @@ void bli_sgemmsup_rv_zen_asm_6x32m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -1928,6 +1931,7 @@ void bli_sgemmsup_rv_zen_asm_6x16m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -2302,6 +2306,7 @@ void bli_sgemmsup_rv_zen_asm_4x64m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm1", "xmm4",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -2604,6 +2609,7 @@ void bli_sgemmsup_rv_zen_asm_4x48m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm1", "xmm4",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -2897,6 +2903,7 @@ void bli_sgemmsup_rv_zen_asm_4x32m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm1", "xmm4",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -3182,6 +3189,7 @@ void bli_sgemmsup_rv_zen_asm_4x16m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm1", "xmm4",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -3466,6 +3474,7 @@ void bli_sgemmsup_rv_zen_asm_2x64m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -3741,6 +3750,7 @@ void bli_sgemmsup_rv_zen_asm_2x48m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -4007,6 +4017,7 @@ void bli_sgemmsup_rv_zen_asm_2x32m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -4263,6 +4274,7 @@ void bli_sgemmsup_rv_zen_asm_2x16m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -4513,6 +4525,7 @@ void bli_sgemmsup_rv_zen_asm_1x64m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -4756,6 +4769,7 @@ void bli_sgemmsup_rv_zen_asm_1x48m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -4991,6 +5005,7 @@ void bli_sgemmsup_rv_zen_asm_1x32m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -5221,6 +5236,7 @@ void bli_sgemmsup_rv_zen_asm_1x16m_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",

View File

@@ -487,6 +487,7 @@ void bli_sgemmsup_rv_zen_asm_6x64n_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -1022,6 +1023,7 @@ void bli_sgemmsup_rv_zen_asm_5x64n_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -1515,6 +1517,7 @@ void bli_sgemmsup_rv_zen_asm_4x64n_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm1", "xmm4",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -2009,6 +2012,7 @@ void bli_sgemmsup_rv_zen_asm_3x64n_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -2462,6 +2466,7 @@ void bli_sgemmsup_rv_zen_asm_2x64n_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -2896,6 +2901,7 @@ void bli_sgemmsup_rv_zen_asm_1x64n_avx512
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm0", "xmm1", "xmm2", "xmm3", "xmm4", "xmm5", "xmm6", "xmm7", "xmm12",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",

View File

@@ -1075,6 +1075,8 @@ void bli_dgemmsup_rv_zen4_asm_24x1
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -1689,6 +1691,8 @@ void bli_dgemmsup_rv_zen4_asm_16x1
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -2221,6 +2225,8 @@ void bli_dgemmsup_rv_zen4_asm_8x1
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",

View File

@@ -1197,6 +1197,8 @@ void bli_dgemmsup_rv_zen4_asm_24x2
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -1901,6 +1903,8 @@ void bli_dgemmsup_rv_zen4_asm_16x2
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -2492,6 +2496,8 @@ void bli_dgemmsup_rv_zen4_asm_8x2
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",

View File

@@ -1313,6 +1313,8 @@ void bli_dgemmsup_rv_zen4_asm_24x3
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -2103,6 +2105,8 @@ void bli_dgemmsup_rv_zen4_asm_16x3
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -2752,6 +2756,8 @@ void bli_dgemmsup_rv_zen4_asm_8x3
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",

View File

@@ -1429,6 +1429,8 @@ void bli_dgemmsup_rv_zen4_asm_24x4
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -2311,6 +2313,8 @@ void bli_dgemmsup_rv_zen4_asm_16x4
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -3020,6 +3024,8 @@ void bli_dgemmsup_rv_zen4_asm_8x4
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",

View File

@@ -1599,6 +1599,8 @@ void bli_dgemmsup_rv_zen4_asm_24x5
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -2614,6 +2616,8 @@ void bli_dgemmsup_rv_zen4_asm_16x5
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -3421,6 +3425,8 @@ void bli_dgemmsup_rv_zen4_asm_8x5
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",

View File

@@ -1718,6 +1718,8 @@ void bli_dgemmsup_rv_zen4_asm_24x6
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -2823,6 +2825,8 @@ void bli_dgemmsup_rv_zen4_asm_16x6
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -3689,6 +3693,8 @@ void bli_dgemmsup_rv_zen4_asm_8x6
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",

View File

@@ -1835,6 +1835,8 @@ void bli_dgemmsup_rv_zen4_asm_24x7
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -3027,6 +3029,8 @@ void bli_dgemmsup_rv_zen4_asm_16x7
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -3950,6 +3954,8 @@ void bli_dgemmsup_rv_zen4_asm_8x7
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",

View File

@@ -1915,6 +1915,8 @@ void bli_dgemmsup_rv_zen4_asm_24x8
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -3190,6 +3192,8 @@ void bli_dgemmsup_rv_zen4_asm_16x8
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",
@@ -4164,6 +4168,8 @@ void bli_dgemmsup_rv_zen4_asm_8x8
: // register clobber list
"rax", "rbx", "rcx", "rdx", "rsi", "rdi",
"r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15",
"xmm2", "xmm31",
"ymm2",
"zmm0", "zmm1", "zmm2", "zmm3",
"zmm4", "zmm5", "zmm6", "zmm7", "zmm8", "zmm9", "zmm10",
"zmm11", "zmm12", "zmm13", "zmm14", "zmm15",