[rocm-libraries] ROCm/rocm-libraries#5646 (commit 05680a4)

[CK_TILE] Add conv bwd data tests MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit ## Motivation This PR adds tests for CK Tile's convolution backward data operation to enable functionality regression tracking and error-detection. ## Technical Details Currently only NHWGC/GKCYX/NHWGK and NDHWGC/GKCZYX/NDHWGK(2 dim and 3 dim channel-last) layouts are being tested, since only they are implemented in CK Tile. Current tests support FP16, BF16 and FP32 datatypes and various different convolutions scenarios. The tested instances are listed in `experimental/grouped_convolution_tile_instances` directory. ## Test Result All implemented tests are working properly and passing.
2026-05-13 17:55:48 +00:00 · 2026-04-21 21:50:07 +00:00
parent 7bcaa73a3a
commit 9d34174ac2
4 changed files with 280 additions and 16 deletions
--- a/experimental/builder/include/ck_tile/builder/testing/conv/ck_tile.hpp
+++ b/experimental/builder/include/ck_tile/builder/testing/conv/ck_tile.hpp
@@ -118,14 +118,11 @@ template <auto SIGNATURE, typename InDataType, typename WeiDataType, typename Ou

        if constexpr(ConvDirectionIsBackwardData<SIGNATURE>)
        {
-            if(kargs.k_batch > 1)
-            {
-                ck_tile::hip_check_error(
-                    hipMemsetAsync(kargs.in_ptr,
-                                   0,
-                                   zeroing_size * sizeof(typename Types::EDataType),
-                                   s_conf.stream_id_));
-            }
+            ck_tile::hip_check_error(
+                hipMemsetAsync(kargs.in_ptr,
+                               0,
+                               zeroing_size * sizeof(typename Types::EDataType),
+                               s_conf.stream_id_));
        }
    };

--- a/experimental/grouped_convolution_tile_instances/generate_instances.py
+++ b/experimental/grouped_convolution_tile_instances/generate_instances.py
@@ -566,14 +566,12 @@ def parse_bwd_data_instances(instances, problem_name):
        if pipeline_version == "V6":
            print(f"Skipping instance {instance_id} with V6 since it's not supported yet.")
            continue
-
-        # Check vector sizes for A and B tensors - we cannot oversubscribe.
-        num_tile_elements_a = m_per_xdl * k_per_xdl
-        num_tile_elements_b = n_per_xdl * k_per_xdl
-        max_vector_size_a = max(1, num_tile_elements_a // block_size)
-        max_vector_size_b = max(1, num_tile_elements_b // block_size)
-        a_scalar_per_vector = min(a_scalar_per_vector, max_vector_size_a)
-        b_scalar_per_vector = min(b_scalar_per_vector, max_vector_size_b)
+        if k_per_block > (warp_size * a_scalar_per_vector) or n_per_block > (warp_size * b_scalar_per_vector):
+            print(f"Skipping instance {instance_id} with multiple warps per continous tile dim since it's not supported yet.")
+            continue
+        if a_scalar_per_vector > (m_per_block * k_per_block) // block_size or  b_scalar_per_vector > (n_per_block * k_per_block) // block_size:
+            print(f"Skipping instance {instance_id} because current scalar per vector exceedes tile size")
+            continue

        conv = ConvInstanceTemplateParams(
            spec,
--- a/test/grouped_convnd_bwd_data/CMakeLists.txt
+++ b/test/grouped_convnd_bwd_data/CMakeLists.txt
@@ -22,6 +22,17 @@ if(GPU_TARGETS MATCHES "gfx9|gfx11|gfx12")
    target_link_libraries(test_grouped_conv_bwd_data_scale PRIVATE gtest_main getopt::getopt utility device_grouped_conv3d_bwd_data_scale_instance)
 endif()

+if(GPU_TARGETS MATCHES "gfx9")
+  if(CK_EXPERIMENTAL_BUILDER)
+    add_gtest_executable(test_grouped_convnd_bwd_data_tile test_grouped_convnd_bwd_data_tile.cpp)
+    target_compile_options(test_grouped_convnd_bwd_data_tile PRIVATE -Wno-global-constructors -Wno-undef -Wno-c++20-compat)
+    target_link_libraries(test_grouped_convnd_bwd_data_tile PRIVATE gtest_main getopt::getopt utility)
+    if(TARGET device_grouped_conv_bwd_data_tile_instances)
+        target_link_libraries(test_grouped_convnd_bwd_data_tile PRIVATE device_grouped_conv_bwd_data_tile_instances)
+    endif()
+  endif()
+endif()
+
 if (CK_USE_XDL OR CK_USE_WMMA) 
    add_gtest_executable(test_grouped_convnd_bwd_data_interface test_grouped_convnd_bwd_data_interface.cpp)
    if(result EQUAL 0)
--- a/test/grouped_convnd_bwd_data/test_grouped_convnd_bwd_data_tile.cpp
+++ b/test/grouped_convnd_bwd_data/test_grouped_convnd_bwd_data_tile.cpp
@@ -0,0 +1,258 @@
+// Copyright (c) Advanced Micro Devices, Inc., or its affiliates.
+// SPDX-License-Identifier: MIT
+
+#include <cstdlib>
+#include <iostream>
+#include <initializer_list>
+#include <vector>
+#include <gtest/gtest.h>
+
+#include "ck_tile/builder/testing/conv/ck_tile.hpp"
+#include "ck_tile/host/device_prop.hpp"
+#include "profiler/grouped_convolution_backward_data_tile_algs.hpp"
+
+static ck::index_t args_mask      = 0xffff;
+static ck::index_t instance_index = -1;
+
+namespace ckb = ck_tile::builder;
+namespace ckt = ck_tile::builder::test;
+namespace ckp = ck_tile::builder::profiling;
+
+template <ck_tile::index_t num_spatial_dim_,
+          ckb::DataType data_type_,
+          ckb::DataType acc_data_type_,
+          ckb::TensorLayout in_layout_,
+          ckb::TensorLayout wei_layout_,
+          ckb::TensorLayout out_layout_>
+struct SignatureDetails
+{
+    static constexpr ck_tile::index_t num_spatial_dim = num_spatial_dim_;
+    static constexpr ckb::DataType data_type          = data_type_;
+    static constexpr ckb::DataType acc_data_type      = acc_data_type_;
+    static constexpr ckb::TensorLayout in_layout      = in_layout_;
+    static constexpr ckb::TensorLayout wei_layout     = wei_layout_;
+    static constexpr ckb::TensorLayout out_layout     = out_layout_;
+};
+
+template <typename SignatureDetailsType>
+class TestGroupedConvndBwdDataTile : public ::testing::Test
+{
+    protected:
+    static constexpr auto SIGNATURE =
+        ckt::ConvSignature{.spatial_dim            = SignatureDetailsType::num_spatial_dim,
+                           .direction              = ckb::ConvDirection::BACKWARD_DATA,
+                           .data_type              = SignatureDetailsType::data_type,
+                           .accumulation_data_type = SignatureDetailsType::acc_data_type,
+                           .input  = {.config = {.layout = SignatureDetailsType::in_layout}},
+                           .weight = {.config = {.layout = SignatureDetailsType::wei_layout}},
+                           .output = {.config = {.layout = SignatureDetailsType::out_layout}}};
+
+    std::vector<ckt::Args<SIGNATURE>> conv_args;
+    std::vector<std::string> split_ks{"1", "2"};
+
+    template <ck::index_t NDimSpatial>
+    void Run()
+    {
+        ASSERT_FALSE(conv_args.empty());
+        bool pass = true;
+        for(size_t i = 0; i < conv_args.size(); i++)
+        {
+            for(auto& split_k : split_ks)
+            {
+                if((args_mask & (1 << i)) == 0)
+                {
+                    continue;
+                }
+                auto& args = conv_args[i];
+
+                auto inputs  = alloc_inputs(args);
+                auto outputs = alloc_outputs(args);
+                ckt::init_tensor_buffer_uniform_int(
+                    inputs.get().weight, args.make_weight_descriptor(), -5, 5);
+                ckt::init_tensor_buffer_uniform_int(
+                    inputs.get().output, args.make_output_descriptor(), -5, 5);
+
+                HIP_CHECK_ERROR(
+                    hipMemset(outputs.get().input,
+                              0,
+                              args.make_input_descriptor().get_element_space_size_in_bytes()));
+
+                std::cout << args.make_input_descriptor() << std::endl;
+                std::cout << args.make_weight_descriptor() << std::endl;
+                std::cout << args.make_output_descriptor() << std::endl;
+                [[maybe_unused]] auto&& [case_passed,
+                                         avg_time,
+                                         op_name,
+                                         best_split_k,
+                                         best_instance] =
+
+                    ckp::run_grouped_conv_backward_data_tile_algs(
+                        args,
+                        split_k,
+                        -1,
+                        inputs.get(),
+                        outputs.get(),
+                        ck_tile::stream_config{nullptr, false /*time_kernel*/});
+
+                pass = pass && case_passed;
+            }
+        }
+        EXPECT_TRUE(pass);
+    }
+
+    void conv_args_append(std::size_t,
+                          std::size_t G,
+                          std::size_t N,
+                          std::size_t K,
+                          std::size_t C,
+                          const std::vector<std::size_t>& filter_spatial_lengths,
+                          const std::vector<std::size_t>& input_spatial_lengths,
+                          const std::vector<std::size_t>& conv_filter_strides,
+                          const std::vector<std::size_t>& conv_filter_dilations,
+                          const std::vector<std::size_t>& input_left_pads,
+                          const std::vector<std::size_t>& input_right_pads)
+    {
+        ckt::Args<SIGNATURE> args = {
+            .lengths =
+                {
+                    .batch_size      = N,
+                    .groups          = G,
+                    .input_channels  = C,
+                    .output_channels = K,
+                    .image = ckt::filter_extent_from_vector<SignatureDetailsType::num_spatial_dim>(
+                        input_spatial_lengths),
+                    .filter = ckt::filter_extent_from_vector<SignatureDetailsType::num_spatial_dim>(
+                        filter_spatial_lengths),
+                },
+            .filter_strides = ckt::filter_extent_from_vector<SignatureDetailsType::num_spatial_dim>(
+                conv_filter_strides),
+            .filter_dilation =
+                ckt::filter_extent_from_vector<SignatureDetailsType::num_spatial_dim>(
+                    conv_filter_dilations),
+            .input_left_pad = ckt::filter_extent_from_vector<SignatureDetailsType::num_spatial_dim>(
+                input_left_pads),
+            .input_right_pad =
+                ckt::filter_extent_from_vector<SignatureDetailsType::num_spatial_dim>(
+                    input_right_pads),
+            .a_elementwise_op   = {},
+            .b_elementwise_op   = {},
+            .cde_elementwise_op = {},
+        };
+        conv_args.push_back(args);
+    }
+};
+
+using KernelTypes2d = ::testing::Types<SignatureDetails<2,
+                                                        ckb::DataType::FP32,
+                                                        ckb::DataType::FP32,
+                                                        ckb::TensorLayout::NHWGC,
+                                                        ckb::TensorLayout::GKYXC,
+                                                        ckb::TensorLayout::NHWGK>,
+                                       SignatureDetails<2,
+                                                        ckb::DataType::FP16,
+                                                        ckb::DataType::FP32,
+                                                        ckb::TensorLayout::NHWGC,
+                                                        ckb::TensorLayout::GKYXC,
+                                                        ckb::TensorLayout::NHWGK>,
+                                       SignatureDetails<2,
+                                                        ckb::DataType::BF16,
+                                                        ckb::DataType::FP32,
+                                                        ckb::TensorLayout::NHWGC,
+                                                        ckb::TensorLayout::GKYXC,
+                                                        ckb::TensorLayout::NHWGK>>;
+
+using KernelTypes3d = ::testing::Types<SignatureDetails<3,
+                                                        ckb::DataType::FP32,
+                                                        ckb::DataType::FP32,
+                                                        ckb::TensorLayout::NDHWGC,
+                                                        ckb::TensorLayout::GKZYXC,
+                                                        ckb::TensorLayout::NDHWGK>,
+                                       SignatureDetails<3,
+                                                        ckb::DataType::FP16,
+                                                        ckb::DataType::FP32,
+                                                        ckb::TensorLayout::NDHWGC,
+                                                        ckb::TensorLayout::GKZYXC,
+                                                        ckb::TensorLayout::NDHWGK>,
+                                       SignatureDetails<3,
+                                                        ckb::DataType::BF16,
+                                                        ckb::DataType::FP32,
+                                                        ckb::TensorLayout::NDHWGC,
+                                                        ckb::TensorLayout::GKZYXC,
+                                                        ckb::TensorLayout::NDHWGK>>;
+
+template <typename SignatureDetailsType>
+class TestGroupedConvndBwdDataTile2d : public TestGroupedConvndBwdDataTile<SignatureDetailsType>
+{
+};
+
+template <typename SignatureDetailsType>
+class TestGroupedConvndBwdDataTile3d : public TestGroupedConvndBwdDataTile<SignatureDetailsType>
+{
+};
+
+TYPED_TEST_SUITE(TestGroupedConvndBwdDataTile2d, KernelTypes2d);
+TYPED_TEST_SUITE(TestGroupedConvndBwdDataTile3d, KernelTypes3d);
+
+TYPED_TEST(TestGroupedConvndBwdDataTile2d, Test2D)
+{
+    this->conv_args.clear();
+
+    // GroupedGemmGroupsNum = 4, ZTilde * YTilde * XTilde = 4, MaxGroupedGemmGroupsNum = 32
+    this->conv_args_append(2, 2, 2, 16, 16, {3, 3}, {28, 28}, {2, 2}, {1, 1}, {1, 1}, {1, 1});
+    // GroupedGemmGroupsNum = 9, ZTilde * YTilde * XTilde = 36, MaxGroupedGemmGroupsNum = 32
+    this->conv_args_append(2, 2, 2, 16, 16, {3, 3}, {28, 28}, {6, 6}, {1, 1}, {1, 1}, {1, 1});
+    // GroupedGemmGroupsNum = 36, ZTilde * YTilde * XTilde = 36, MaxGroupedGemmGroupsNum = 32
+    this->conv_args_append(2, 2, 2, 16, 16, {6, 6}, {28, 28}, {6, 6}, {1, 1}, {1, 1}, {1, 1});
+    // GroupedGemmGroupsNum = 32, ZTilde * YTilde * XTilde = 32, MaxGroupedGemmGroupsNum = 32
+    this->conv_args_append(2, 2, 2, 16, 16, {4, 8}, {28, 28}, {4, 8}, {1, 1}, {1, 1}, {1, 1});
+    this->conv_args_append(2, 2, 2, 192, 192, {3, 3}, {28, 28}, {1, 1}, {1, 1}, {1, 1}, {1, 1});
+    this->conv_args_append(2, 2, 2, 128, 256, {3, 3}, {14, 14}, {1, 1}, {1, 1}, {1, 1}, {1, 1});
+    this->conv_args_append(2, 2, 2, 128, 256, {1, 1}, {7, 7}, {2, 2}, {1, 1}, {0, 0}, {0, 0});
+    this->conv_args_append(2, 2, 2, 128, 256, {1, 1}, {3, 3}, {1, 1}, {1, 1}, {0, 0}, {0, 0});
+    this->conv_args_append(2, 2, 2, 32, 32, {2, 2}, {12, 12}, {3, 3}, {1, 1}, {0, 0}, {0, 0});
+    this->conv_args_append(2, 2, 2, 32, 32, {2, 2}, {12, 12}, {2, 2}, {2, 2}, {0, 0}, {0, 0});
+    this->conv_args_append(2, 1, 6, 448, 896, {1, 1}, {118, 182}, {2, 2}, {1, 1}, {0, 0}, {0, 0});
+    this->conv_args_append(2, 1, 1, 1, 32, {8, 8}, {16, 16}, {1, 1}, {1, 1}, {1, 1}, {1, 1});
+    this->conv_args_append(2, 1, 1, 64, 3, {8, 8}, {16, 16}, {1, 1}, {1, 1}, {1, 1}, {1, 1});
+    this->conv_args_append(2, 1, 1, 1, 1, {8, 8}, {16, 16}, {1, 1}, {1, 1}, {1, 1}, {1, 1});
+    this->template Run<2>();
+}
+
+TYPED_TEST(TestGroupedConvndBwdDataTile3d, Test3D)
+{
+    this->conv_args.clear();
+    this->conv_args_append(
+        3, 2, 2, 128, 256, {1, 1, 1}, {7, 7, 7}, {2, 2, 2}, {1, 1, 1}, {0, 0, 0}, {0, 0, 0});
+    this->conv_args_append(
+        3, 2, 2, 128, 256, {3, 3, 3}, {14, 14, 3}, {1, 1, 1}, {1, 1, 1}, {1, 1, 1}, {1, 1, 1});
+    this->conv_args_append(
+        3, 2, 2, 128, 256, {1, 1, 1}, {3, 3, 3}, {1, 1, 1}, {1, 1, 1}, {0, 0, 0}, {0, 0, 0});
+    this->conv_args_append(
+        3, 2, 2, 32, 32, {1, 2, 2}, {1, 12, 12}, {1, 3, 3}, {1, 1, 1}, {0, 0, 0}, {0, 0, 0});
+    this->conv_args_append(
+        3, 2, 2, 32, 32, {1, 2, 2}, {1, 12, 12}, {1, 2, 2}, {1, 2, 2}, {0, 0, 0}, {0, 0, 0});
+    this->conv_args_append(
+        3, 1, 1, 1, 32, {3, 3, 3}, {4, 16, 16}, {1, 1, 1}, {1, 1, 1}, {1, 1, 1}, {1, 1, 1});
+    this->conv_args_append(
+        3, 1, 1, 64, 3, {3, 3, 3}, {4, 16, 16}, {1, 1, 1}, {1, 1, 1}, {1, 1, 1}, {1, 1, 1});
+    this->conv_args_append(
+        3, 1, 1, 1, 1, {3, 3, 3}, {4, 16, 16}, {1, 1, 1}, {1, 1, 1}, {1, 1, 1}, {1, 1, 1});
+    this->template Run<3>();
+}
+
+int main(int argc, char** argv)
+{
+    testing::InitGoogleTest(&argc, argv);
+    if(argc == 1) {}
+    else if(argc == 3)
+    {
+        args_mask      = strtol(argv[1], nullptr, 0);
+        instance_index = atoi(argv[2]);
+    }
+    else
+    {
+        std::cout << "Usage of " << argv[0] << std::endl;
+        std::cout << "Arg1,2: args_mask instance_index(-1 means all)" << std::endl;
+    }
+    return RUN_ALL_TESTS();
+}