[CK TILE] Refactor grouped conv fwd large tensor (#3144)

2026-05-01 20:21:23 +00:00 · 2025-11-04 00:34:48 +01:00
parent c7ded76cc7
commit 99f38e4d9b
5 changed files with 161 additions and 167 deletions
--- a/include/ck_tile/ops/grouped_convolution/kernel/grouped_convolution_forward_kernel.hpp
+++ b/include/ck_tile/ops/grouped_convolution/kernel/grouped_convolution_forward_kernel.hpp
@@ -434,14 +434,13 @@ struct GroupedConvFwdKernelArgs
 ///                                     multiplication implementation. It is responsible for storing
 ///                                     results calculated by @ref GemmPipeline_ "GemmPipeline" to
 ///                                     the output C tensor in global memory.
-template <bool EnableSplitImage_,
-          typename GroupedConvTraitsType_,
+template <typename GroupedConvTraitsType_,
          typename TilePartitioner_,
          typename GemmPipeline_,
          typename EpiloguePipeline_>
 struct GroupedConvolutionForwardKernel
 {
-    static constexpr bool EnableSplitImage = EnableSplitImage_;
+    static constexpr bool EnableSplitImage = GroupedConvTraitsType_::EnableSplitImage;
    static constexpr index_t NDimSpatial   = GroupedConvTraitsType_::NDimSpatial;
    static constexpr ConvolutionSpecialization ConvSpecialization =
        GroupedConvTraitsType_::ConvSpecialization;