Revert "Revert " Fp8 block scale quantization for fmha fwd (#3330)" (#3633)" (#3635)

This reverts commit de5a1d730d. Co-authored-by: Illia Silin <98187287+illsilin@users.noreply.github.com>
2026-05-02 20:51:23 +00:00 · 2026-01-24 01:03:22 +08:00
parent 2e08a7e5ab
commit 67f0b74ec6
14 changed files with 667 additions and 84 deletions
--- a/include/ck_tile/ops/fmha/block/block_attention_quant_scale_enum.hpp
+++ b/include/ck_tile/ops/fmha/block/block_attention_quant_scale_enum.hpp
@@ -12,6 +12,7 @@ enum class BlockAttentionQuantScaleEnum
 {
    NO_SCALE  = 0,
    PERTENSOR = 1,
+    BLOCKSCALE,
 };

 template <BlockAttentionQuantScaleEnum>
@@ -27,5 +28,10 @@ struct BlockAttentionQuantScaleEnumToStr<BlockAttentionQuantScaleEnum::PERTENSOR
 {
    static constexpr const char* name = "pertensor";
 };
+template <>
+struct BlockAttentionQuantScaleEnumToStr<BlockAttentionQuantScaleEnum::BLOCKSCALE>
+{
+    static constexpr const char* name = "blockscale";
+};

 } // namespace ck_tile